Intelligence artificielle : la bataille pour l'accès aux données
Cet article est exclusivement accessible aux abonnés.
Les éditeurs d'intelligence artificielle générative sont en pleine effervescence : ils sont à la recherche de nouvelles données pour améliorer les algorithmes. Les données actuellement utilisées seront épuisées d'ici 2028.
Écrit par Jacques Henno
Face à leur succès croissant, les éditeurs d'intelligence artificielle générative sont confrontés à de nombreux défis. Ils ont du mal à trouver de l'espace pour stocker leurs serveurs et leurs données d'entraînement, ainsi que des systèmes de refroidissement dont les délais de livraison sont devenus cinq fois plus longs en raison de l'essor de l'IA. De plus, ils rencontrent des difficultés à trouver des sous-traitants et des sources de données pour nourrir leurs intelligences artificielles en apprentissage. Selon Pablo Villalobos, chercheur chez Epoch AI, si de nouvelles sources de données ne sont pas trouvées, il pourrait y avoir une pénurie dès 2028.
En réalité, les LLM (Large Language Models) nécessitent de plus en plus de données pour leur apprentissage. Pablo Villalobos estime que la taille des bases utilisées augmente de dix fois tous les deux ans. Jusqu'à présent, les éditeurs de GenAI ont cherché à maximiser la quantité de données en collectant des données gratuites à partir du web grâce à un processus de "crawl" où un robot explore Internet et récupère tout ce qu'il trouve, explique Jean Ponce, professeur d'informatique à l'Ecole normale supérieure et directeur scientifique de PRAIRIE, l'un des instituts français d'IA.
Cette information est uniquement disponible pour les abonnés ayant souscrit aux offres Access et Premium.
Analyse économique et tous les articles sur le patrimoine : l'abonnement Access est parfait pour vous !
Nos vidéos
Qui sont les véritables bénéficiaires des paris sportifs en ligne ?
Les pays du Club Med comme le Portugal, l'Espagne et la Grèce prennent leur revanche.
Est-ce que les jeunes rencontrent réellement des difficultés avec le travail ?
Est-ce que la concurrence dans le secteur ferroviaire peut faire baisser les prix des billets de train ?
Les articles les plus consultés
Quel est le défi du diamant de laboratoire face au diamant naturel ?
Quel est le record ultime dans l'épreuve reine du 100 mètres aux JO de Paris 2024 ?
En vedette
La crise des naissances continue en France
Lucie Castets n'arrive pas à émerger à gauche
Comment Israël se prépare à une éventuelle guerre régionale
Sciences & Prospective
Quel est le record ultime dans l'épreuve reine du 100 mètres aux JO de Paris 2024 ?
Le défi du diamant de laboratoire contre le diamant naturel
La fausse viande : la fin ne justifie pas les moyens
Pratique
P
L'équipe
Tous les droits sont réservés à Les Echos en 2024.






