Des chercheurs d’Apple ont développé une IA qui teste des idées en parallèle avant de répondre

Report: Apple planning to launch Apple Intelligence in China before end of 2025

Un nouvel article de recherche d’Apple émerge avec une approche innovante visant à améliorer la qualité des réponses des modèles linguistiques de grande taille (LLMs). Intitulé LaDiR : La Diffusion Latente Renforce les LLMs pour le Raisonnement Textuel, ce travail explore des méthodes prometteuses qui pourraient transformer la manière dont ces systèmes abordent des tâches complexes telles que le raisonnement mathématique et la génération de code.

Un nouveau paradigme dans le raisonnement

La recherche met en lumière les différences entre les modèles de diffusion et les modèles autoregressifs. Les modèles de diffusion générèrent du texte en itérant simultanément sur de nombreux éléments, tandis que les modèles autoregressifs traitent les informations séquentiellement, un élément à la fois. LaDiR tente de marier ces deux approches pour améliorer le raisonnement des LLMs.

En combinant la diffusion durant le processus de raisonnement et en utilisant la génération autoregressive pour la réponse finale, LaDiR représente une avancée significative. L’innovation repose sur la capacité du modèle à explorer plusieurs chemins de raisonnement en parallèle, chacun développant ses propres idées et solutions potentielles, ce qui permet d’obtenir un éventail varié de réponses.

Des chercheurs dApple ont developpe une IA qui teste des

Lors de la phase d’inférence, le modèle élabore des blocs de raisonnement cachés qui commencent par un motif aléatoire. Ce bruit initial est progressivement affiné en une réponse structurellement cohérente. LaDiR ne se limite pas à un seul chemin de raisonnement et encourage la diversité dans ses explorations, garantissant que le modèle ne se fixe pas trop rapidement sur une réponse unique, ce qui serait contre-productif.

Performances impressionnantes de LaDiR

Dans les tests, LaDiR a été mis à l’épreuve sur des modèles comme LLaMA 3.1 8B pour le raisonnement mathématique et Qwen3-8B-Base pour la génération de code. Les résultats sont prometteurs : LaDiR a dépassé les performances de méthodes existantes sur plusieurs benchmarks mathématiques, révélant une plus grande précision, même dans des scénarios difficiles.

1777503638 857 Des chercheurs dApple ont developpe une IA qui teste des

En matière de génération de code, LaDiR a également montré sa valeur en produisant des résultats plus fiables sur des tests tels que HumanEval, battant le fine-tuning traditionnel de manière significative, particulièrement pour des problèmes complexes.

1777503639 11 Des chercheurs dApple ont developpe une IA qui teste des

Par ailleurs, dans des tâches de planification de style puzzle, comme le jeu Countdown, LaDiR a su proposer un plus large éventail de réponses valides. Bien qu’il ait excellé par sa capacité à identifier des solutions correctes, il a rencontré des limitations face à des modèles spécifiques à une tâche, notamment en termes de précision à une seule tentative.

1777503639 618 Des chercheurs dApple ont developpe une IA qui teste des

Ce travail de LaDiR est riche en enseignements pour quiconque s’intéresse aux mécanismes des modèles linguistiques de grande taille. L’exploration de nouvelles voies pour améliorer la génération de texte est un domaine fascinant qui ne manquera pas d’évoluer dans les années à venir. Ce document est recommandé pour ceux qui souhaitent approfondir leurs connaissances des LLMs.