Après une itération continue des grands modèles, la compétition des produits se dirige vers les scénarios et l'expérience

Auteur : Frank, PANews

Alors que l’IA passe progressivement du spectacle à l’utilité pratique, la mise en œuvre des applications d’IA s’accélère pour répondre à la demande croissante des consommateurs. Par ailleurs, avec l’amélioration continue des capacités des grands modèles, il semble que l’IA soit entrée dans une ère où « tout le monde peut créer un prototype de produit ».

Pendant la semaine de l’IA de muShanghai, lors de la table ronde organisée par PANews « Innovation pratique et exploration des voies de l’écosystème de consommation de l’IA », l’accent a été mis sur les véritables voies de mise en œuvre des produits d’IA grand public. Les invités participants comprenaient Feng Wen, responsable produit de la plateforme ouverte MiniMax, Levy, CEO de FateTell, Anita, responsable d’APAC chez Sentient, ainsi que Gao Jiafeng, musicien électronique et développeur indépendant, issus de domaines variés tels que la plateforme d’ouverture de modèles, les applications culturelles à l’international, l’écosystème open source d’IA et la pratique de la création musicale.

Selon eux, le cœur du problème de l’IA grand public ne s’est pas simplifié avec l’évolution technologique. Après la montée en capacité des modèles, les véritables barrières se déplacent vers la compréhension des scénarios, l’organisation des données, l’éducation des utilisateurs, la valeur émotionnelle et la construction d’un écosystème ouvert.

L’IA n’a pas réduit la difficulté de l’entrepreneuriat, les véritables barrières restent liées aux scénarios d’application

Une contradiction courante dans l’industrie de l’IA est la suivante : à mesure que les modèles deviennent plus puissants, le seuil d’entrée pour l’entrepreneuriat semble diminuer, mais beaucoup de produits peinent à trouver des scénarios durables à long terme. Les applications qui semblent réalisables aujourd’hui peuvent rapidement perdre leur pertinence avec la sortie de la prochaine version du modèle.

Selon Feng Wen, pour les produits d’IA grand public, l’idée du produit et la jugement du scénario restent primordiaux. En tant que fournisseur de la plateforme ouverte de grands modèles, MiniMax met davantage l’accent sur la capacité sous-jacente des modèles, la conception de produits liés aux tokens, ainsi que sur l’expérience de bout en bout pour les développeurs. Mais du point de vue de l’entrepreneur, le produit doit être conçu en fonction du « niveau d’intelligence du modèle après six mois ».

Il estime qu’en contexte où la loi de l’échelle des modèles n’a pas encore failli et où la capacité des modèles continue de s’améliorer, les entrepreneurs ne doivent pas se limiter excessivement à la vitesse, au coût ou aux limites de capacité actuelles des modèles, mais plutôt penser plus audacieusement aux utilisateurs cibles, aux scénarios spécifiques et aux problèmes à résoudre. Les fournisseurs de modèles continueront à offrir des capacités plus économiques, plus rapides et avec un meilleur rapport qualité-prix, tandis que la couche applicative doit répondre clairement à la question « pourquoi ce scénario ».

Levy ajoute une autre source de barrière au niveau applicatif. Selon lui, la rapidité des changements technologiques ne supprime pas rapidement la nécessité de données et de compréhension associées aux scénarios. Beaucoup pensaient auparavant que seul le fine-tuning du modèle pouvait créer une barrière de données ; mais avec la maturité de l’ingénierie contextuelle et des prompts, les données et structures accumulées dans la gestion du contexte peuvent également influencer la performance du modèle. En particulier, certaines données très verticales, liées à la culture ou à l’expérience personnalisée, ne seront pas nécessairement intégrées dans les poids du modèle général, ce qui peut devenir une différenciation pour la résistance à l’évolution des modèles dans le domaine de l’IA grand public.

Anita adopte une vision plus prudente concernant la « réduction des barrières à l’entrée » par l’IA. Elle pense que, certes, l’IA facilite la génération d’échantillons de démonstration, la création de prototypes et le déploiement rapide d’un produit initial, mais que la difficulté réelle de l’entrepreneuriat ne disparaît pas, voire devient plus marquée : comment attirer des clients, comment construire une communauté fidèle, comment concrétiser une idée en business, comment établir des connexions humaines en dehors de la programmation. Elle mentionne que le concept de super-individu ou de « solo entrepreneur » est très en vogue actuellement, mais que pour réussir, un individu doit posséder des compétences plus diversifiées, et pas seulement faire appel à de grands modèles.

De la Bazi à la musique : une meilleure compréhension de l’utilisateur, une barrière pour l’IA grand public

Alors que la capacité technologique progresse, la valeur des produits d’IA grand public doit finalement revenir aux besoins humains.

L’exemple de FateTell illustre bien cette tendance. Levy explique que FateTell est une application d’IA + divination orientale / Bazi destinée aux utilisateurs étrangers, comptant aujourd’hui plus de 90 pays. L’équipe a délibérément évité une orientation purement utilitaire, privilégiant la consommation spirituelle et la valeur émotionnelle.

Selon lui, comprendre son destin, chercher des explications et du réconfort sont des besoins psychologiques fondamentaux, transculturels et durables. L’IA a longtemps eu du mal à instaurer la confiance dans ce contexte, mais avec l’amélioration de modèles comme DeepSeekR1, il devient objectivement possible d’aider les utilisateurs et investisseurs à comprendre que « de grands modèles peuvent faire des raisonnements complexes et des explications ». Le défi de FateTell ne réside pas uniquement dans la capacité du modèle, mais aussi dans la traduction et la transposition des concepts culturels chinois tels que les tiges célestes et les branches terrestres, le Yi Jing, le Bazi, pour les rendre compréhensibles aux utilisateurs étrangers, en utilisant la langue, le visuel et l’interaction pour faire découvrir la richesse de cette culture.

Gao Jiafeng soulève une question similaire du point de vue des créateurs de musique : l’IA ne doit pas se limiter à fournir un résultat, mais aussi préserver le processus créatif. Il mentionne que des outils comme Suno rendent la génération musicale très directe, mais sautent souvent l’étape de la création, ce qui prive l’utilisateur de participation et de sentiment d’appartenance. Pour les musiciens et les utilisateurs ordinaires, la création n’est pas seulement une fin en soi, mais aussi une expérience en soi.

Il compare cela à jouer au football : même si une personne ne pourra jamais surpasser Messi ou Cristiano Ronaldo, elle continuera à jouer par amour du jeu. La création musicale est similaire. Gao développe actuellement MusicAIGameBoy, une console de jeu musicale alimentée par l’IA, qui utilise des grands ou petits modèles pour générer du code musical, combiné à une interaction ludique, permettant à des non-musiciens de participer à la création lors du jeu. Pour lui, le véritable scénario n’est pas « générer automatiquement une chanson », mais redonner aux utilisateurs le processus interactif de création musicale.

L’essor des agents modifie la logique d’éducation des utilisateurs

Dans les produits d’IA grand public, l’éducation des utilisateurs détermine souvent leur adoption effective.

Feng Wen mentionne que, parmi les utilisateurs de la plateforme ouverte MiniMax, certains ont des bases en développement, mais sont encore freinés par la documentation API, les paramètres, les codes d’erreur et l’utilisation des tokens. La plateforme propose donc des essais de modèles, des guides de développement, des cas de démonstration, des tutoriels vidéo, afin d’accélérer la compréhension et l’utilisation.

Avec l’évolution des agents, la manière d’éduquer les utilisateurs change également. Auparavant, il fallait lire la documentation, comprendre l’interface, diagnostiquer les erreurs. Aujourd’hui, avec l’amélioration des performances des agents, beaucoup d’utilisateurs laissent l’agent lire la documentation, rechercher des solutions, choisir le bon modèle et corriger automatiquement le chemin. Les fournisseurs de modèles doivent soigner l’expérience du modèle, la documentation et la plateforme, tandis que la communauté, les développeurs et diverses formes de produits contribuent à réduire la barrière à l’entrée.

Pour Sentient, l’écosystème open source lui-même constitue une partie de l’éducation des utilisateurs et de la mise en œuvre du produit. Anita explique que Sentient se concentre sur l’écosystème open source d’IA et les infrastructures associées, en organisant des hackathons, des programmes de financement, pour rassembler les développeurs. Elle insiste sur le fait que le produit doit d’abord bien définir ses cibles : qui sont les utilisateurs, où ils se trouvent, par quels canaux établir la confiance. Pour les outils de développement, les hackathons et la coopération écologique sont des portes d’entrée efficaces ; pour les produits de consommation, les influenceurs, les KOL, les KOC et le contenu sur les réseaux sociaux sont tout aussi importants.

Dans un contexte où le coût de l’AIGC diminue rapidement, les équipes de startup peuvent produire à moindre coût des bandes-annonces, des visuels et du contenu promotionnel, pour atteindre plus rapidement leur première base d’utilisateurs. Gao Jiafeng pense également que la conception des produits doit se rapprocher des utilisateurs, permettant une apprentissage naturel lors de l’interaction et du divertissement, plutôt que de dépendre uniquement de manuels volumineux. Cette approche « apprendre en utilisant » pourrait être plus adaptée que les tutoriels traditionnels pour l’IA grand public.

Le matériel dans le monde réel, la personnalisation et la valeur émotionnelle en expansion

Dans trois à cinq ans, les invités s’accordent à dire que le marché de l’IA grand public est encore à ses débuts, mais que la forme des produits connaîtra des changements significatifs.

Feng Wen prévoit qu’au cours de cette période, les appareils intelligents, les robots et l’intelligence incarnée connaîtront un tournant important. Après l’amélioration des capacités des modèles, l’IA ne sera plus confinée à l’interface logicielle, mais s’intégrera dans le monde physique, réalisant davantage d’interactions et de tâches. Certains produits seront destinés aux humains, pour augmenter l’efficacité ou apporter une valeur émotionnelle. D’autres seront orientés vers des agents, fournissant à l’IA des environnements, outils et infrastructures pour se connecter au monde physique. Quoi qu’il en soit, la finalité reste centrée sur l’humain, en lui permettant de consacrer plus de temps aux relations, à la famille, au monde réel et à des expériences de vie plus riches.

Levy pense que prévoir dans un horizon de trois à cinq ans dans le domaine de l’IA est déjà très difficile, voire incertain même à trois ou cinq mois. Bien que certains utilisateurs avancés exploitent déjà profondément des outils comme ClaudeCode, la majorité des utilisateurs ordinaires en sont encore à un stade précoce d’intégration de l’IA. Dans les années à venir, l’IA répondra à des besoins plus fragmentés et personnels. Par rapport à l’époque du mobile, où les services étaient souvent uniformes, l’IA pourrait offrir des services plus spécifiques et segmentés pour chaque individu. Par ailleurs, l’anxiété liée au chômage et l’incertitude économique pourraient accentuer la demande de compagnons numériques et de consommation spirituelle.

Anita résume cette évolution par une « égalité technologique ». Elle pense que, dans le futur, la distinction entre sciences humaines, sciences exactes, arts et technologies s’atténuera. Même un petit commerçant pourra utiliser l’IA pour créer des publicités ou cibler des messages, améliorant ainsi son activité. La valeur de l’IA ne sera pas forcément de faire de chacun un programmeur de haut niveau, mais d’aider les personnes dans divers contextes de vie à accéder à de meilleurs outils. Par ailleurs, la peur du chômage et la solitude renforceront la demande de valeur émotionnelle, avec davantage de matériel, d’animaux de compagnie IA, d’appareils de compagnie et d’interactions multisensorielles.

Gao Jiafeng aborde cette transformation sous l’angle des formes culturelles : il pense que, à l’avenir, la musique, le cinéma, la vidéo et autres contenus seront recomposés, et même que la « chanson » pourrait ne plus être l’unité minimale de consommation musicale. Les concepts actuels comme la séparation des pistes audio ou des couches seront probablement encore plus atomisés. Mais en même temps, l’attachement émotionnel aux IP, aux marques et aux personnages réels deviendra encore plus crucial. Ce que les gens recherchent, ce ne sont pas seulement des œuvres parfaites, mais aussi des objets imparfaits, chaleureux, capables de créer une relation émotionnelle.

Bien que les invités n’aient pas fourni une réponse unique sur l’avenir de l’IA grand public, leurs discussions issues de domaines variés — plateforme de modèles, applications culturelles, écosystème open source, création musicale — convergent vers une même tendance : à mesure que la capacité des modèles progresse, la compétition ne se résumera plus à « qui utilise le modèle le plus puissant », mais à la capacité de comprendre des utilisateurs plus spécifiques, des scénarios réels et des besoins émotionnels.

L’écosystème futur de l’IA grand public pourrait combiner une infrastructure ouverte plus avancée, des seuils de développement plus faibles, des services plus personnalisés, du matériel plus empathique, et de nouveaux produits liés à la culture et à la création. Les modèles continueront d’évoluer, mais ce qui restera, ce seront les produits qui répondent aux besoins, à la compréhension et aux liens humains.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé