Semalt: Comment fonctionne le wiki dans différentes langues?

Oliver King, le responsable de la réussite client de Semalt , explique que Wikipédia possède une vaste gamme de données, d'articles et de contenu dans différentes langues, et les éditeurs sont encouragés à créer les articles manquants sur cette encyclopédie géante. Il est sûr de dire que Wikipedia existe dans plus de trois cents langues, mais la plupart d'entre elles sont incomplètes et relativement petites. Des gens de toutes les régions du monde visitent quotidiennement Wikipédia et lisent plus de 300 éditions linguistiques. Certains d'entre eux recherchent des articles et des contenus spécifiques écrits par des centaines à des milliers d'écrivains bénévoles qui sont responsables de la construction et de la maintenance de cette encyclopédie gratuite et célèbre. Les visiteurs de Wikipédia recherchent principalement les articles en anglais, et les autres langues représentent 30 millions d'entrées sur le wiki.

Démocratiser l'accès au savoir

Pour aider les écrivains et rédacteurs en chef de diverses communautés linguistiques à évaluer les articles manquants, les experts en informatique de la Wikimedia Foundation et de Stanford ont créé avec succès certains outils. L'un d'eux aide à identifier les articles importants qui ne sont pas encore disponibles dans une langue particulière. Les éditeurs utilisent ensuite ces recommandations pour créer de nouveaux articles. Si les éditeurs et les rédacteurs sont multilingues, il est très facile de trouver des articles dans une deuxième langue et de les traduire dans la langue locale pour les lecteurs de Wikipédia.

Ainsi, ce système identifiera d'abord l'éditeur de Madagascar qui souhaite écrire en français et lui demandera de compléter les parties manquantes d'un article et de le faire publier sur Wikipedia malgache. De cette façon, les éditeurs peuvent créer des articles pour différentes personnes dans le monde, ce qui peut à son tour influencer l'expérience utilisateur globale.

Les chercheurs de la Wikimedia Foundation, Leila Zia et Ellery Wulczyn, ont collaboré avec l'étudiant de l'Université de Stanford, Robert West, pour présenter un rapport à la Conférence internationale du World Wide Web, à Montréal. Selon eux, Wikipedia possède une grande quantité de données et il existe une relation étroite entre ses articles.

Les scientifiques ont commencé à créer des listes d'articles dans différentes langues et à recouper les listes pour savoir quels articles manquent dans quelles langues. Ils ont ensuite estimé l'importance de tous les articles manquants en fonction de leur pertinence géographique et culturelle. Ils visent à publier les articles manquants dans les plus brefs délais et à obtenir de meilleurs classements.

Combler les lacunes

Les chercheurs ont testé les lieux avec une série d'expériences. Ils ont commencé le projet avec plus de 4 millions d'articles écrits en anglais et ont découvert que plus de 1,5 million d'articles manquaient dans la section Wikipedia française. Les experts ont ensuite sélectionné les 300 000 articles importants en anglais et les ont traduits en français. Les articles ont été divisés en trois groupes principaux de plus de 100 000 articles chacun et ont été remis aux meilleurs éditeurs et aux plus expérimentés. Le nœud de l'expérience impliquait deux groupes principaux de six mille éditeurs et écrivains qui ont effectué plusieurs éditions en français et en anglais dans les douze mois avant la fin de l'expérience. En juin 2015, tous les rédacteurs ont reçu un e-mail leur signalant les articles uniques manquants et ont été invités à traduire la liste complète des articles de l'anglais vers la langue française. Un mois plus tard, les experts ont accédé à la création d'article manquante et ont constaté qu'ils pouvaient augmenter les taux de création d'articles organiques. Sur la base de tous ces résultats, la Fondation Wikipédia a développé des outils expérimentaux où les éditeurs et les écrivains peuvent trouver les lacunes dans leurs langues locales et se diriger vers des entrées spécifiques.

mass gmail