– Elle peut servir à tout, de l’aide à l’écriture à la classification de textes en passant par l’aide à la programmation », explique Ariel Ekberg, chercheur à AI Sweden, un centre national d’IA appliquée financé à la fois par le secteur privé et par le secteur public.

Le modèle a été développé dans le cadre d’un projet de recherche et a été entraîné sur l’internet suédois avec des sources telles que les archives scientifiques numériques Diva, 1177, la base de données pharmaceutique FASS et la banque de littérature. Mais aussi sur des forums ouverts tels que Flashback.

– Nous avons eu l’ambition d’inclure le plus grand nombre possible de documents, y compris des documents controversés. Mais nous ne pensons pas qu’il nous appartient de prendre des décisions en matière de censure. Nous pensons qu’il est préférable de savoir à quoi vont servir ces modèles », déclare Ariel Ekberg.

La formation n’est pas suffisante pour éliminer les préjugés

Chat SW3 est un modèle de base qui pourrait être utilisé à la fois dans le secteur public et comme base pour des produits commerciaux.

Les chatbots commerciaux tels que chatGPT et le moteur de recherche Bing ont déjà été critiqués pour avoir généré des textes racistes ou inappropriés. Mais former l’IA à éliminer les préjugés à la base n’est pas pertinent, selon Ekberg.

– Bing et Chat GPT sont des développements ultérieurs et des produits basés sur des modèles linguistiques. Lorsque l’on développe de tels produits, il est très important de vérifier ce qu’ils disent et de comprendre s’ils sont biaisés. Mais nous avons une longueur d’avance sur ce point, et nous n’avons donc pas besoin d’y travailler activement.