Sur Firefox :
une minimap !

Darknet_corpus

Arts et technologies

Afficher/ Masquer

Zlibrary, Anna's Archive + WorldCat

2024-07-18 00:32

[TODO] (ne pas commencer par Zlib !, situer)

À la chute de Z library en 2022, en suivant les dry_papers [on] se rend compte des revenus générés. Cette bibliothèque d'ebooks illégaux est la plus visitée [sources/vérifier ?]. Cela a une toute autre échelle que les marchés noirs de stupéfiants sur le Darknet, mais suffisament pour que, durant le procès, les ayants droits attaquent l'inculpé sur ce point : l'entreprise illicite fait des bénéfices illégitimes, au détriment des auteur.es et maisons d'édition. Le syndicat des auteurs américains, à l'origine de cette plainte [source], vient souligner des motivations financières plutôt que des motivations bienfaisantes, promouvant la diffusion culturelle. Et, en effet, aussi altruiste/désintéressée soit Z-library, son envergure
[ TODO reprendre le dry_paper ] :

annas-archive émerge un peu dans la précipitation [quelques jours après : source.blog] la chute de Z-library en 2022. Le projet est, [comme indiqué plus haut], d'une envergure démesurée (hubris) qui sonne comme un défit / une prouesse technique. Plusieurs plaintes ont déjà été portées à l'encontre d'annas-archive. L'une d'entre elles, en 2024, de la part de WorldCat (via l'OCLC) pour avoir attaqué leurs serveurs en vue d'en siphonné les méta-données (scraping).

Page Wikipedia au sujet d'Anna's Archive :
In response to the scrape, Anna's Archive was sued on January 12, 2024 by OCLC, one of the maintainers of WorldCat. OCLC says that the scrape was the result of cyberattacks on its servers and that Anna's Archive allows public download of scraped data.[wiki11]

FR : En réponse à ce scrape, Anna's Archive a été poursuivie en justice le 12 janvier 2024 par OCLC, l'un des responsables de WorldCat. OCLC affirme que le scrape est le résultat de cyberattaques sur ses serveurs et que Anna's Archive autorise le téléchargement public des données scrappées[wiki11].

[wiki11]: Van der Sar, Ernesto (February 7, 2024). "Lawsuit Accuses Anna's Archive of Hacking WorldCat, Stealing 2.2 TB Data" : https://torrentfreak.com/lawsuit-accuses-annas-archive-of-hacking-worldcat-stealing-2-2-tb-data-240207/.

https://en.wikipedia.org/wiki/Anna's_Archive


Anna's Archive revendiquera l'extratction de données ainsi que celle de ISBNdb et Open Library (dataset) :

venn.svg
NB: Le schéma [ci-dessus] laisse à penser qu'il s'agit des bibliothèques elles-même alors qu'il est question des métadonnées (relatives à l'ouvrage, elles sont importantes pour leur indexation précise dans le catalogue). On peut y trouver des informations rares comme les bibliothèques où le livre est disponible.

https://annas-archive.org/blog/worldcat-scrape.html
https://annas-archive.se/blog/blog-isbndb-dump-how-many-books-are-preserved-forever.html



On retrouve le même argument de la part de l'OCLC qu'à l'encontre de Z-library, des revenus substantiels via divers services proposés par Anna's Archive

“For example, a $5 per month subscription will give a visitor ’20 fast downloads per day,’ while a $100 per month subscription grants a visitor ‘1000 fast downloads per day’ and naming rights to a torrent file on Anna’s Archive (‘Adopt a torrent’).”

FR : "Par exemple, un abonnement de 5$ par mois permettra à un visiteur d'effectuer 20 téléchargements rapides par jour, tandis qu'un abonnement de 100$ par mois permettra à un visiteur d'effectuer '1000 téléchargements rapides par jour' et d'obtenir le droit de nommer un fichier torrent sur Anna's Archive ('Adopt a torrent')."

NB: OCLC (en charge des serveurs de WorldCat) n'aurait pas été hacké :>
https://www.infodocket.com/2024/02/07/report-lawsuit-accuses-annas-archive-of-hacking-worldcat-stealing-2-2-tb-data/

Sources relatives au procès :
Lawsuit Accuses Anna’s Archive of Hacking WorldCat, Stealing 2.2 TB Data, 2024
https://torrentfreak.com/images/oclc-vs-anna.pdf

Le 7 novembre 2022, TorrentFreak, un site spécialisé sur les activités illicites relatives au piratage / échange de fichiers, relate que Z_Library vient d'être saisi par le FBI :

Une semaine plus tard, annas-archive annonce son ouverture et vocation d'archiver les bibliothèques (numériques), dont Z-library :

Le 19 novembre 2022 (à 18:57:09 UTC+1) nous faisons un compte rendu de la situation, récoltons quelques liens et ressources relative. Le site est utilisé par énormément de personnes, aussi les réactions sont nombreuses sur les réseaux [source, utilisateurs ?]. Comme souvent dans ces affaire [et comme mentioné plus haut], le dry_papers de l'affaire donnera de nombreux éléments explicatifs quant aux moyens mis en œuvre de la part des enquêteurs (ainsi que des failles qui ont permis d'identifier l'accusé). Au regard de la rapidité à laquelle le site sera remis en ligne, on comprend qu'uniquement une partie de l'équipe (administrateurs) a été capturée. Comme le mentionne TorrentFreak, d'autres services/sites sont saisis (tel la ‘GLOBAL Electronic library,’).

Our research revealed that more than 130 associated domain names (see below) were caught up in this enforcement action, including z-lib.org, book4you.org, u1lib.org, bookmail.org, b-ok.org, b-ok.cc, booksc.xyz, bookos-z1.org, vn1lib.club, zlibcdn.com, and usa1lib.org.

FR : Nos recherches ont révélé que plus de 130 noms de domaine associés (voir ci-dessous) étaient concernés par cette action, notamment z-lib.org, book4you.org, u1lib.org, bookmail.org, b-ok.org, b-ok.cc, booksc.xyz, bookos-z1.org, vn1lib.club, zlibcdn.com et usa1lib.org.

https://torrentfreak.com/z-library-aftermath-reveals-that-the-feds-seized-dozens-of-domain-names-221107/

[ces précisions //LibGen devraient être en intro]
Les ayants droits (dont la Guilde Américaine de Auteurs [source, vérifier]) qui ont saisi la justice portent un coup à un écosystème jusqu'alors rarement inquiété, agissant en impunité sur le ClearWeb. Z-library est alors considéré comme le successeur de l'ancestrale bibliothèque LibGen qui compte l'un des plus grands catalogues d'ebooks distribués gratuitement en ligne. La courte généalogie que nous avons remontée ici relate l'évolution d'un marché controversé et qui a su s'adapter, évoluer avec le temps.

Captures réalisées en juillet 2024
avec un compte personnel connecté
Z-library

Le portail d'accès d'origine a été saisi :
zlibrary.se_sized_capture.png
https://fr.go-to-zlibrary.se



Nouvelle version, nom de domaine :
singlelogin.re_home_capture.png
https://fr.singlelogin.re



Le nouveau site (nom de domaine) est localisé en Moldavie
singlelogin.re_geotool_carte.png
https://iplookup.flagfox.net/?ip=176.123.7.105&host=fr.singlelogin.re



Z-library met en place des accès diversifiés, dont un HS (Hidden Service via Tor) :
singlelogin.re_liens_apps_capture.png
https://fr.go-to-library.sk/#useful_link_tab



Le lien vers le HS (Hidden Service, site .onion, accessible via Tor) dissimule l'origine du serveur via des relais successifs à travers le monde :
singlelogin.re_onion_circuit_capture_crop.png

Captures réalisées en juillet 2024
L'ouvrage de démonstration choisi ici est utilisé comme exemple dans l'article de annas archive : 1.3B WorldCat scrape & data science mini-competition 2023

On peut l'acquérir sur différents sites/marchés, dont :




WorldCat
worldcat_search_capture.png




annas-archive

anna_home_page_capture.png

anna_search_capture.png

anna_book_capture.png