Données utilisées par GPT 4 : D’où viennent-elles ?

10 000 milliards de mots : voilà l’ordre de grandeur, brutal, qui résume l’ampleur du chantier derrière GPT-4. Oubliez la cartographie transparente ou la liste soignée des sources, il faut se contenter de fragments, d’indices, et d’une opacité savamment entretenue. OpenAI mentionne des corpus vastes, venus des quatre coins d’Internet, sans jamais lever le voile sur le détail. Manuels, encyclopédies, …

The post Données utilisées par GPT 4 : D’où viennent-elles ? appeared first on Web de Bretagne.