People Magazine Undercover Kimi 100 heures : une entreprise d'IA qui se plie délibérément en deux dimensions

Cet article spécial dévoile le noyau réel de la startup d’IA la plus suivie en Chine.

Auteur : Liu Mo (Personnage Magazine)

Traduction : Deep Tide TechFlow

Note éditoriale de Deep Tide : Il s’agit de l’une des reportages internes sur les entreprises d’IA les plus approfondis publiés par Personnage Magazine. Le journaliste a été autorisé à passer 100 heures à l’intérieur de Moonshot AI, en observant de près cette société évaluée à plus de 1200 milliards de yuans, et ne comptant que 300 et quelques personnes. Des secousses collectives après l’impact de DeepSeek, à la gestion « extrême » en mode ultra-plat sans « département, sans KPI, sans échelon », puis à l’évolution organisationnelle façon « essaim de génies » — cet article spécial dévoile le véritable noyau de la startup d’IA la plus scrutée de Chine.

Au printemps 2026, Kimi lui est particulièrement favorable.

En l’espace de quelques mois seulement, l’entreprise derrière Kimi semble enchaîner les percées — revenus, levées de fonds, valorisation, tout bat des records. Une étude publiée par une étudiante de 17 ans en stage au lycée a reçu des éloges venus de la Silicon Valley, dont ceux de Elon Musk. L’outil de programmation Cursor, évalué à environ 50 milliards de dollars américains, est pointé par des observateurs chinois comme s’appuyant massivement sur le modèle de Kimi en termes d’expérience produit. Autrement dit, Kimi semble avoir remporté la victoire sur trois fronts à la fois : le capital, la technologie et la commercialisation.

Cette entreprise n’a que trois ans, mais sa valorisation a déjà dépassé 1200 milliards de yuans, soit environ 16 milliards de dollars. Dans le récit mondial autour de l’IA, elle ne peut plus être ignorée.

Mais le côté obscur de la Lune (Moonshot AI) reste profondément mystérieux.

J’ai été autorisé à entrer dans l’entreprise et à l’observer pendant 100 heures. En tant que journaliste indépendant, je peux interviewer n’importe quel employé disposé à parler, écouter n’importe quelle réunion qui ne concerne pas des secrets commerciaux, et, une fois l’article terminé, personne ne procédera à une relecture, et personne ne paiera ma rédaction. C’est exactement le style de cette société.

En entrant au bureau, on a l’impression d’être au cœur de la tempête.

Dans la zone centrale, le silence est inhabituel. Sur les postes, on n’entend que des claviers par intermittence, et parfois quelqu’un rit. Mais à l’extérieur, le bruit — rumeurs, débats, battage, imitations, commentaires sans fin — semble ne laisser aucune trace ici.

L’entreprise ne compte que 300 et quelques personnes, et l’âge moyen est de moins de 30 ans. En divisant la valorisation par le nombre de personnes, chaque employé porte sur ses épaules une valeur d’entreprise d’environ 400 millions de yuans.

Environ 80 % des employés sont des « I » dans le contexte des conversations sur Internet — introvertis, en empruntant la notion du MBTI. Les gens sont assis ensemble, mais taper au clavier est plus confortable que parler. Ici, l’introversion n’est pas un défaut : presque une sorte de protocole de fonctionnement.

Je repense à cette soirée lors de ma première visite en 2024, quand la tempête ne faisait que commencer à se préparer. À ce moment-là, je n’avais pas laissé une impression particulièrement bonne.

« DeepSeek nous a sauvés »

Le 24 décembre 2024, la veille de Noël. Pour la plupart des Chinois, ce n’est pas un jour férié en tant que tel. Mais pour Julian, c’est devenu l’une des nuits les plus sombres de sa vie.

Elle a 26 ans. Elle est diplômée de l’université de Pékin (PKU) depuis seulement deux ans, sans aucune expérience dans l’industrie, et pourtant elle fait déjà partie des tout premiers employés de Kimi. Ce soir-là, cette employée très jeune mais déjà considérée comme « expérimentée » — à sa façon — s’est mise à pleurer dans une salle de réunion appelée « Radiohead », assise devant une longue table, face à plus de 30 collègues.

Elle n’avait pas encore réussi à livrer une proposition de marketing de Noël qui satisfasse les cofondateurs.

Il ne restait plus qu’un mois avant le Nouvel An lunaire. Le plan le plus récent a déjà été modifié six fois, et il faut maintenant encore le mettre à niveau, au point qu’on pourrait même tout reprendre depuis le début. Reconstruire le plan à partir de zéro, puis coordonner les équipes produit et ingénierie pour l’exécuter : le temps ne suffit presque pas. Pourtant, l’entreprise place de grands espoirs sur la croissance de Kimi pendant le Nouvel An lunaire 2025.

C’est crucial, car l’année précédente, c’est précisément pendant le Nouvel An lunaire que Kimi a explosé. Grâce au positionnement de marque « 2 millions de caractères de saisie pour de longs textes », Kimi a été omniprésent en Chine. L’afflux d’utilisateurs grand public a explosé, et même le marché A Share a vu apparaître l’expression « actions liées à Kimi ».

Ce séminaire hebdomadaire a été long et impitoyable.

Environ 20 jeunes employés se sont succédé pour présenter tout : publicité sur les réseaux sociaux, gestion des utilisateurs, relations publiques nationales, marketing à l’étranger, du détail le plus fin au plus général. Tout le monde discutait collectivement, puis les cofondateurs tranchèrent.

À l’époque, Kimi ressemblait à un adolescent en pleine crise d’identité : talentueux, prometteur, mais incapable de tout contrôler à 100 % par lui-même. Même avec un budget publicitaire mensuel atteignant des dizaines de millions de yuans, face à des concurrents qui montaient rapidement, l’entreprise paraissait encore un peu maladroite.

La réunion s’est terminée vers 4 heures du matin.

Personne ne savait si le plan final de Julian allait réussir. Un mois plus tard, cela n’avait plus d’importance.

À cet instant, le monde entier a entendu pour la première fois parler de DeepSeek.

Hayley, chargée de la croissance, est retournée à Wenzhou pour les fêtes du Nouvel An. Là, elle a découvert que ses parents, parents et amis posaient tous la même question : « Tu as déjà entendu parler de DeepSeek ? » Kimi semblait être devenue, en une nuit, un vieux sujet.

Elle a dit que c’était le Nouvel An lunaire le plus difficile de toute sa vie. Le silence interne de l’entreprise était assourdissant.

L’assemblée annuelle de l’ensemble des employés a généralement lieu en mars après la nouvelle année, et les employés peuvent poser des questions directement à la direction. Cette année-là, presque toutes les questions tournaient autour de DeepSeek.

Les questions les plus incisives venaient de l’équipe RH. Ils ont apporté une sincérité totale, et ils ont dit la phrase qui mettait mal à l’aise :

« Les candidats nous demandent : DeepSeek m’a aussi fait une offre. Pourquoi devrais-je venir chez Kimi ? — Et nous, comment on répond ? »

Mais toutes les réactions n’étaient pas identiques.

Alex, de l’équipe algorithmes, a dit que, s’il avait ressenti quelque chose de très fort pendant « le moment DeepSeek », ce n’était pas de la peur, mais de l’excitation.

Cette sensation ne le concernait pas seulement lui. Elle reflétait l’état d’esprit de beaucoup de personnes dans l’équipe algorithmes. DeepSeek a prouvé qu’une autre voie pouvait exister : une stratégie à plus faible coût, un chemin via l’open source, et une réalité qu’un grand nombre de gens n’osaient pas croire — une startup chinoise jusque-là peu connue, pour peu que sa technologie soit assez forte et ses modèles assez bons, peut tout de même gagner le respect mondial.

L’équipe produit n’était pas particulièrement anxieuse non plus. Kevin, employé produit dans les tout débuts, pensait que l’explosion de DeepSeek reposait sur le modèle. Une fois que les capacités de modèle de Kimi allaient rattraper, l’équipe produit aurait au contraire plus d’espace pour construire des fonctionnalités à valeur.

Personne de l’extérieur ne savait ce que les cofondateurs discutaient exactement. Mais l’entreprise a agi rapidement. Ajuster la stratégie, réduire la focale : en interne, un consensus proche du parfait s’est formé.

Désormais, si on demande à presque n’importe qui dans l’entreprise ce qui compte le plus, la réponse est sans hésitation : le modèle.

Depuis ce moment-là, le respect interne envers DeepSeek n’a cessé de grandir. Une partie vient de l’admiration professionnelle, et l’autre… d’autre chose.

Alex dit :

« D’une certaine façon, DeepSeek nous a sauvés. »

Le goût est tout

« Comment tu portes ce genre de chaussures ? »

Après qu’Ezra m’a posé cette question, j’ai été encore plus surprise qu’elle. Dans son étage de bureaux, presque tout le monde avait une paire de pantoufles sous son bureau. Des vêtements et des chaussures confortables : tout le monde croit que cela rend plus détendu, plus concentré, et plus créatif.

C’est la règle vestimentaire des gens intelligents.

J’ai vu énormément d’« élèves doués » dans ma vie. Mais ici, les « bons élèves » sont une espèce totalement différente.

En primaire, Ezra a essayé de décrypter le mot de passe de l’ordinateur de sa maison, parce que ses parents ne voulaient pas lui dire. En collège, elle a commencé à s’intéresser au Bitcoin, à l’époque où une unité ne valait que quelques centaines de yuans. Elle a demandé à sa mère de l’argent de poche pour investir. Sa mère a dit que c’était une arnaque. Au lycée, la première fois qu’elle a pris un taxi, dans sa tête, elle a dessiné le prototype d’un produit de réservation de taxi. Elle a dit que si à l’époque il y avait eu les outils d’IA d’aujourd’hui, peut-être qu’elle l’aurait vraiment construit. À l’université, une fois qu’elle a eu son propre argent, elle a investi en A Share et a perdu 90 %.

Cette expérience douloureuse lui a fait comprendre les limites du jugement humain, et l’a poussée vers l’IA.

Sa compréhension de l’AGI (intelligence artificielle générale) est très simple : créer « N Einsteins », les utiliser pour résoudre les problèmes les plus difficiles de l’humanité. Depuis, elle s’est juré de trouver une entreprise qui repousse vraiment les limites de l’AGI. Même si, à ce moment-là, elle avait déjà regagné l’argent qu’elle avait perdu en bourse.

Grâce à un parcours académique exceptionnel, elle a reçu beaucoup d’offres d’entreprises. Elle n’a choisi Kimi que pour une raison : lors de l’entretien, l’approche de Yang Zhilin — sa compréhension de la technique et le niveau de sérieux qu’il apportait aux détails — l’ont profondément impressionnée. Elle pensait qu’il se souciait vraiment des modèles. Il n’avait ni l’agitation superficielle typique des gens « intelligents », ni l’utilitarisme qu’on voit souvent chez les hommes d’affaires. En fait, à la fin de l’entretien, elle ne savait même pas qu’il était cofondateur.

Le tempérament de Karen est différent, mais il l’a mené au même endroit.

Il s’est toujours rebellé. Dispute avec les professeurs, désobéissance aux parents. Au moment d’étudier, il a insisté pour partir à l’étranger ; après le diplôme, il a insisté pour démarrer une entreprise. La vie stable et confortable offerte par les grandes entreprises l’a rendu désespéré : il ne voulait pas d’une existence dont on peut voir le début et la fin dès le départ.

Je lui ai demandé : si tu devais choisir, l’un est sûr d’obtenir 60 points (sur 100), l’autre n’a que 1 % de chances d’obtenir 100. Tu choisirais lequel ?

Sans hésiter, il a choisi le second.

Ce n’est pas qu’il ne pouvait pas accepter 60 points ; c’est qu’il ne supportait pas cette route où tout est à 100 % certain.

Ce « ADN de fondateur » constitue la matière première de base de l’entreprise. Selon une estimation approximative en interne, le côté obscur de la Lune compte au moins 50 personnes qui avaient déjà créé une entreprise ou rejoint une startup auparavant.

Certains disent que Kimi aime recruter des CEO.

Plus exactement : cette entreprise abrite un groupe d’« esprits » de génie en mouvement, de vagabonds talentueux. Un génie n’est pas forcément un étudiant de tout premier rang ou un employé modèle. L’important, c’est que, sur un certain plan, ils peuvent voir au-delà du temps.

Dans une entreprise où environ 80 % des employés viennent des écoles 985 et 211, le CV de Yannis n’est pas particulièrement brillant. Mais dès 2023, dans la communauté d’ingénierie, il avait déjà anticipé que DeepSeek et Kimi allaient émerger — à l’époque, les entreprises de modèles n’avaient même pas encore de produit. Un autre employé né dans les années 2000 (00后) a remarqué sa capacité de jugement et l’a convaincu d’entrer dans l’entreprise.

Karen dit que trop de gens intelligents sont enfermés par le système. D’abord la famille, puis l’école, puis le travail. Ils se soumettent sans s’en rendre compte aux attentes du groupe, et finissent par oublier ce qu’ils veulent vraiment. Seuls quelques-uns essaient de s’enfuir, mais ils sont souvent invisibles.

L’une des missions de Kimi, dit-il, est justement de les voir.

Sans cette intuition, un lycéen de 17 ans ne pourrait pas être recruté pour faire un stage chez Kimi, travailler en équipe pour publier un article, puis recevoir plus tard des éloges de Elon Musk. La personne qui a mis le nom de l’étudiant en premier auteur de l’article, c’est Bob : son mentor, et aussi la première personne qui l’a repéré.

Entre génie et fou, il n’y a qu’un fil. Quand un « fou incompris » arrive au côté obscur de la Lune, il peut soudain devenir un génie capable de changer le monde. Ou alors, certains génies encore invisibles ne peuvent vraiment s’épanouir que dans un endroit comme celui-ci.

Bob m’a dit que, dans une certaine mesure, l’ego n’a rien de problématique, et peut même être une bonne chose. Si cet ego est une force intérieure, et que quelqu’un croit qu’il doit participer à une grande mission, alors il est peut-être précisément la personne que l’entreprise ne peut pas se permettre de manquer.

Le génie est paranoïaque.

Dans cette équipe, l’entraînement de modèles d’IA de pointe est surnommé «炼丹» — une expression courante dans le milieu technologique chinois, qui décrit le processus d’entraînement des modèles comme étant à moitié scientifique, à moitié ésotérique. Mais dans la pratique, «炼丹» signifie corriger des bugs sans arrêt.

À chaque lancement d’un entraînement phare, Bob et ses coéquipiers entrent dans le même rituel. Chaque matin, la première chose est de rafraîchir le gigantesque tableau de bord interne de surveillance de l’entreprise. Des centaines de milliers de métriques. Même si une seule courbe fait un écart anormal, un alarme retentit dans la tête : l’optimisation a-t-elle un problème ? L’architecture présente-t-elle une faille ? La précision numérique ne correspond-elle pas ?

Leurs réactions sont d’une sensibilité presque de niveau animal.

Certains vérifient même token par token les données d’entraînement, et impriment les tokens qui produisent des gradients extrêmes, comme s’ils interrogeaient des suspects : « Pourquoi tu sautes aussi violemment ? »

Chaque personne qui a réellement participé à « livrer » un modèle a vécu ce genre de tension sans sommeil. Ce n’est pas de l’anxiété ; c’est une obsession mue par la curiosité. C’est cette vigilance paranoïaque qui pousse le modèle jusqu’au niveau le plus élevé.

Les génies se rassemblent.

Au cours de l’année passée, Kimi a recruté plus de 100 employés grâce aux recommandations internes — l’ami de l’ami, l’ami de l’ami de l’ami. En interne, l’entreprise appelle ça en plaisantant « de bouche en bouche ».

La confiance, grâce à ces réseaux très denses, devient un type d’actif organisationnel naturel.

Fondamentalement, Kimi transfère la partie la plus difficile de la gestion vers l’étape du recrutement. Si la personne entre parce qu’elle a été recommandée par un collègue digne de confiance, il y a de fortes chances qu’elle ait des intuitions similaires. C’est pour cela qu’un mot revient sans cesse dans l’entreprise :

Goût (Taste).

Un soir de septembre 2025, quelques ingénieurs ont lancé, par simple habitude, un mini-projet interne, nommé Ensoul. Ils voulaient faire « vivre » le code endormi stocké dans les fichiers, le transformer en un assistant conversationnel directement dans la ligne de commande.

Cette sensibilité aux noms n’est pas un hasard.

Ils avaient déjà un framework appelé YAMAHA, abréviation de « Yet Another Moonshot Agent ». L’infrastructure de base au niveau le plus bas s’appelait Kosong, qui signifie « vide » en malais, inspirée de la notion bouddhiste « la forme est le vide ». Cela suggère une feuille blanche : pas de fonctions préchargées, mais un potentiel infini.

Le goût, autrement dit, façonne le produit lui-même.

Quand beaucoup d’entreprises fourrent une fenêtre de discussion dans un terminal, les ingénieurs de Kimi trouvent cela moche. Un vrai programmeur ouvre un terminal pour exécuter des commandes, pas pour discuter. Ainsi, le Kimi CLI a été conçu plutôt comme un shell intelligent que comme une interface de conversation. Il comprend les commandes, sans s’obliger à devenir un panneau de discussion.

Cette simplicité se voit aussi dans le code. La logique centrale ne fait qu’environ 400 lignes de Python, sans tous les ornements inutiles. Les modules sont propres et découplés. Les utilisateurs peuvent personnaliser leurs fonctions eux-mêmes, ou démonter Kimi et le remonter pour en faire leur propre application.

Kimi Agent avait autrefois un lien interne avec la phrase « OK Computer » — encore une référence à Radiohead — puis son nom a été changé, car il était trop obscur pour le public plus large. Les personnes choisissant ces noms semblent ne pas trop s’intéresser à maximiser le trafic. Elles suivent leur propre goût musical et leurs standards linguistiques.

Quelqu’un a même plaisanté : si on juge les entreprises d’IA par la proportion d’employés capables de jouer d’un instrument, Kimi pourrait arriver premier.

Le goût est devenu le critère de recrutement le plus élevé, et aussi le plus difficile à définir.

Il ne peut pas être quantifié, mais il est omniprésent.

Généraliser d’abord, puis évoluer

Vous ne saurez peut-être jamais exactement ce que chaque personne chez Kimi fait.

L’entreprise aime parler de « équipes » plutôt que de « départements ». Vu de la haute direction, les grandes directions sont suffisamment claires : algorithmes, produit et ingénierie, croissance, stratégie, opérations. Mais dès qu’on tente de regarder en détail le découpage réel des départements ou les responsabilités fixes, tout devient flou.

Parce qu’il s’agit d’une organisation sans département officiel, sans hiérarchie, sans title, sans OKR, et sans KPI. Les relations de reporting sont si simples qu’elles en deviennent presque fictives.

Pour Brandon, cela n’a aucun sens.

Il est diplômé de Tsinghua. Il a travaillé dans la gestion au sein de géants de la Silicon Valley et de grandes entreprises chinoises, aidé une startup valant environ 1 milliard de dollars. Après des années à traverser l’industrie, il est doué en management technique et a dirigé une équipe de près de 1000 personnes. Il espérait entrer dans le domaine de l’IA, et y donner la pleine mesure de ses capacités.

Mais les cofondateurs, Zhang Yutong, lui ont dit que cette entreprise ne fonctionne pas comme ça. S’il se joignait, les personnes qu’il gérerait directement auraient probablement deux personnes tout au plus.

Mais quelque chose, lié à l’avenir, l’a retenu. Il voulait en reparler une fois.

Ainsi, en janvier 2025, en pleine période où des doutes et de l’inquiétude se répandaient dans l’entreprise, Brandon a rencontré Yang Zhilin — son camarade de Tsinghua.

À l’époque, Brandon ne savait pas encore que, plus tard, le nom de Yang Zhilin apparaîtrait dans le même type d’article que Elon Musk et Jensen Huang. Ce dont il se souvient le plus clairement, c’est que, après les salutations de base, Yang Zhilin a prononcé sa première phrase :

« Le renforcement par apprentissage est l’avenir. »

Le dialogue suivant ressemblait presque à Yang Zhilin qui se parlait à lui-même. Il était absorbé par ses propres idées ; Brandon ne comprenait pas vraiment de quoi il parlait, même si tout était expliqué en chinois.

Mais une chose était extrêmement claire : c’était la première fois de sa vie que son système de connaissances, construit pendant 20 ans, et ses modèles de pensée commençaient à s’effondrer. Avec lui, son ego s’est aussi effondré.

Je lui ai demandé pourquoi il avait finalement rejoint. Son ton était un peu mystérieux : Yang Zhilin allait peut-être devenir un grand prophète, parce qu’il avait une vision, et qu’il était assez pur.

Plus tard, lorsque la société a hésité sur la manière de définir son rôle dans ce système où il y avait presque pas de title, Brandon a répondu avec fermeté :

« Même si on me laisse balayer les toilettes, je viens. Et je les balayerai plus proprement que n’importe qui. »

Tous les anciens managers ou experts des grandes entreprises ne peuvent pas survivre dans ce genre d’environnement.

Phoebe, née dans les années 2000 (00后), est passée de l’équipe croissance à l’équipe produit et ingénierie. Elle se moquait d’elle-même en disant qu’elle était « une petite fille qui ne comprend rien », mais elle a dit une chose importante : dans cette entreprise, une expérience profonde et un CV brillant peuvent au contraire devenir un fardeau.

L’IA est trop nouvelle, les changements trop rapides. Un expert expérimenté n’apprend pas et ne s’adapte pas forcément plus vite qu’un jeune qui suppose et teste.

Elle a vu au moins trois parachutages de cadres moyens et supérieurs venant de grandes entreprises échouer. L’un d’eux a fini par choisir de quitter l’industrie, disant que les gens autour étaient vraiment trop jeunes, trop intelligents. Après avoir été constamment dépassé, il a abandonné. Il a conclu que ce n’était plus son époque, et que ce n’était plus son industrie.

Après l’impact de DeepSeek, Phoebe a aussi ressenti une crise profonde. Elle a décidé d’abandonner le travail d’achat de trafic, et d’aider l’entreprise via le produit et l’ingénierie. Elle s’est lancée dans un auto-apprentissage intensif, allant même jusqu’à diffuser en direct sur B 站 (Bilibili) son processus d’apprentissage, accumulant des centaines d’heures.

Ce qui l’a le plus surprise, c’est que l’entreprise, dès le début, lui a donné sans hésiter l’opportunité de changer de poste.

En fait, parmi les 30 employés que j’ai interviewés, plus de la moitié ont déjà changé de responsabilités plusieurs fois. Par rapport à leur travail précédent, environ 80 % des gens font aujourd’hui des choses totalement différentes.

Kimi aime les gens capables de « généraliser ».

Dans le domaine de l’IA, généraliser signifie que le modèle se comporte bien dans de nouveaux contextes en dehors des données d’entraînement. Ce n’est pas apprendre par cœur des réponses, mais apprendre la structure de base.

L’entreprise a aussi appliqué cette idée aux personnes.

Les cadres moyens et supérieurs venant des grandes entreprises peuvent avoir optimisé trop longtemps dans un certain système de KPI, dans une certaine langue de reporting, dans un certain jeu de politique interne. Leur « algorithme » a sur-appris à un optimum local. Quand l’environnement change complètement, ils ne peuvent peut-être pas s’adapter.

Si l’on compare : les employés des grandes entreprises traditionnelles ressemblent à des modèles spécialisés, tandis que ceux que veut le côté obscur de la Lune ressemblent davantage à des modèles de base. D’abord, apprendre les règles fondamentales via un entraînement par supervision fine-tuning. Ensuite, acquérir la capacité de transfert entre domaines grâce au renforcement par apprentissage et à des jeux répétés d’auto-competition entre tâches.

James, revenu de Silicon Valley, a 26 ans. Il dit que son rêve est « de donner l’argent aux jeunes ».

En tant que croyant fervent en l’IA, il considère son propre corps comme des capteurs permettant à un Agent de collecter des informations. Quand il joue à « League of Legends », il enregistre l’audio et collecte des données physiologiques comme la fréquence cardiaque et le pouls, puis analyse quels discours des coéquipiers influencent son état émotionnel et ses performances dans le jeu.

Ses propos sont si tranchants qu’ils frôlent l’extrême. Il dit : « Si une personne ne commence à apprendre une véritable nouvelle langue qu’après 14 ans, elle n’atteindra jamais un niveau de locuteur natif. » Il estime que l’IA fonctionne aussi de manière similaire.

Dan, qui a rejoint l’entreprise juste après son diplôme, dit que la première fois de sa vie qu’il a ressenti une vraie anxiété liée à la connaissance.

À l’école, il n’avait entraîné que des « modèles jouets » — environ 7 milliards de paramètres, quelques jours avec 32 GPU, et c’était fini. Aujourd’hui, il doit gérer des modèles MoE (mixture of experts / mélange d’experts) avec des centaines de milliards de paramètres. Les données d’entraînement se comptent en milliers de milliards de tokens. Il a l’impression de passer directement d’une petite mare à l’océan Pacifique.

Pour rester au rythme, il est presque entré dans un mode d’apprentissage auto-sadique. Son rythme de vie s’est complètement effondré : les jours à Pékin sont devenus la nuit en Silicon Valley, puis à l’inverse. Il fixe les panneaux d’entraînement pendant des centaines d’heures, comme un trader qui surveille son écran, sans même avoir le temps de cligner des yeux.

Le vrai défi n’est pas seulement le volume de travail : c’est qu’il doit faire trois métiers en même temps.

Il doit être architecte d’algorithmes : concevoir la meilleure solution dans un labyrinthe de choix de modèles. Il doit être ingénieur système : comme dépanner un pipeline qui traverse le monde, déboguer les problèmes de calcul distribué. Il doit être « maître炼丹» des données : appliquer l’art de la « luyện丹 » à de gigantesques ensembles de données, pour que le modèle obtienne de beaux scores sur les benchmarks, tout en gardant une conversation naturelle et douce dans le réel.

Parfois, cela signifie effectuer des opérations urgentes en cours d’entraînement. Une fois, des paramètres clés stockés en précision bf16 ont commencé à avoir un comportement dangereux. L’équipe a pris une décision immédiate : à mi-entraînement, passer à la précision fp32, juste pour stabiliser cette session. Dan dit que si tu ne sais faire que des algorithmes, ou seulement du système, ou seulement du nettoyage de données, tu ne produiras jamais un modèle de premier niveau. Ici, pas d’excuse du type « je m’occupe seulement de cette partie ».

L’entreprise attend de toi que tu intègres le travail d’algorithmes, d’ingénierie et de données, et que tu navigues entre plusieurs mondes. C’est comme faire plusieurs jobs en même temps. Mais cette formation croisée à haute intensité peut te faire gagner des années de progression en très peu de temps.

Ainsi, quiconque veut rejoindre Kimi subit une épreuve impitoyable.

Il n’y a pas d’OKR, pas de KPI, pas de politique de bureau, pas de management façon PUA, et même pas de badgeuse. Mais si tu n’es pas « natif de l’IA », si tu ne peux pas généraliser, si tu ne peux pas renforcer en continu et t’adapter, tu auras du mal à trouver le sens de ton existence ici.

« Ici, il n’y a pas de saveur d’autorité »

La plupart des marques veulent une histoire.

Mais presque chaque employé de Kimi me rappelle doucement : ne parle pas de Pink Floyd, et ne parle pas du piano devant la porte du bureau.

Leur point de vue est : ceux qui comprennent comprendront naturellement, et ceux qui ne comprennent pas n’ont pas besoin de comprendre. Les deux noms Moonshot et Kimi n’ont aucun lien direct avec l’IA ni la technologie. Mais si la société parle trop de sa connexion avec le rock et les arts, elle commencera à paraître trop auto-consciente, trop maniérée. Ils semblent penser que la beauté devrait être une évidence, sans explication.

Win, un 00后 qui est « sorti » des grandes entreprises, me dit que cet endroit est bizarre, parce que les gens peuvent vraiment faire les choses sans réunions.

Chez son ancien employeur, réunions le jour, travail le soir. Elle a appris une vérité simple : si ton énergie est surtout consacrée à coordonner les relations de production, la marge pour améliorer la productivité réelle est presque nulle.

C’est une partie de l’apparence d’une organisation native de l’IA.

Plus de dix employés m’ont clairement dit qu’ils préféraient de plus en plus interagir avec l’IA plutôt qu’avec les gens. L’IA est plus fiable, plus simple. Cette tendance correspond aussi à l’attitude plutôt introvertie de l’ensemble de l’entreprise. Quelqu’un a utilisé un mot plus doux : la timidité.

Dans les discussions de groupe, tout le monde peut être animé et avoir beaucoup d’envie de s’exprimer. Mais quand ils se rencontrent en face-à-face, beaucoup sont silencieux. Kimi organise peu d’activités culturelles. Hormis la réunion annuelle, la dernière activité collective a eu lieu au bureau : des massages.

L’introversion ne signifie pas manquer de communication ou d’énergie.

Même si personne ne leur demande de me parler, aucun d’entre eux ne refuse. Dans les discussions de groupe, l’information ne cesse de voler dans tous les sens, accompagnée de toutes sortes d’emojis abstraits. Aucun message n’est laissé en plan.

Si tu as besoin que quelqu’un coopère pour faire le travail, c’est simple : tu le contactes directement.

Pas besoin de passer par le responsable, pas besoin d’approbation, pas besoin de convoquer une réunion de coordination, pas besoin de percer les murs entre départements.

Kimi n’a pas de murs de département. En un certain sens, il n’a même pas de département.

La signature de Yang Zhilin ne tient qu’en quatre mots :

Communication directe.

Malgré tout, tout le monde reconnaît que depuis sa création, l’entreprise n’a cessé d’évoluer.

Certaines évolutions sont volontaires, d’autres passives, et certaines semblent même être des retournements. L’entreprise est passée d’une stratégie de diffusion massive à une focalisation sur les modèles ; de l’insistance sur la fermeture du code à l’adoption de l’open source ; des produits de chatbot à Kimi Agent, Kimi Code et Kimi Claw ; de l’accès grand public © au modèle B2B puis retour au grand public ©. Toutes ces bifurcations ne supportent pas forcément une analyse parfaite.

Mais pour Ezra, une chose n’a jamais changé : le respect des faits.

Elle pense que toutes ces transformations ont une seule raison et un seul objectif : aligner mieux l’entreprise sur la réalité objective.

L’entreprise tolère l’arrogance, mais n’aime pas ceux qui placent leur propre opinion au-dessus des faits.

Du côté des cofondateurs vers le bas, les gens sont relativement faciles à convaincre — tant que les faits sont assez clairs. Les employés disent que cette volonté vient d’une obsession extrême pour la vérité, la réalité, et « ce qui est vrai ». Les gens vraiment intelligents ne se sentent pas blessés par un retour honnête.

Cette franchise a aussi une condition : l’entreprise n’a pas de culture de « course aux chevaux », pas de concurrence à somme nulle, et pas de gros conflits d’intérêts internes. Les gens sont prêts à partager gratuitement leurs découvertes de recherche et leurs détails techniques, sans attendre de retour ni de crédit signé. Au début, l’entreprise avait sa propre communauté, et aujourd’hui encore, elle prône une culture communautaire. Le partage d’informations et de connaissances accélère l’apprentissage de chacun, et au final, cela profite à tous.

Win dit que les cultures toxiques se contagient, et que les bonnes cultures se contagient aussi.

Quelqu’un décrit l’ambiance ici comme étant de la « solidarité ». C’est un mot qui, utilisé dans une startup, sonne presque un peu vieux. Mais l’environnement dans lequel se trouve l’entreprise est très rude : à l’extérieur, des concurrents de niveau géant ; à l’intérieur, une pression créée par l’étouffement des grandes entreprises ; des ressources de calcul limitées. Si ces contraintes ont un rôle, elles semblent paradoxalement renforcer la cohésion.

Au fond, les êtres humains sont le seul actif vraiment important dans une organisation.

Récemment, Florence a été approchée par un concurrent pour une offre avec un salaire doublé. Elle a immédiatement refusé. La raison est très simple :

« Ici, il n’y a pas de saveur d’autorité. »

Le nouveau bureau de l’entreprise.

« Je ne sais pas comment elle a tenu »

Avant le début de l’entretien, j’étais très nerveuse. Je m’apprêtais à interviewer certains des praticiens d’IA les plus intelligents au monde, et moi je viens d’une filière littéraire, je n’ai jamais travaillé dans l’industrie technologique ; je connaissais relativement peu l’IA.

Mais lorsque j’ai commencé à parler réellement avec de jeunes experts des équipes algorithmes et ingénierie produit, j’ai découvert que la nervosité venait surtout d’eux. Ils avaient peur que si je n’arrivais pas à comprendre les termes, ce soit gênant.

Alors ils ont d’abord traduit l’anglais en chinois, puis ils ont traduit ce chinois-là en un chinois plus simple, que je puisse comprendre.

Ce réflexe de protection est touchant.

Avant de commencer l’entretien, l’entreprise m’a donné une seule instruction : protéger tout le monde.

Alors j’ai essayé d’éviter de poser des questions trop sensibles, ou susceptibles de blesser les gens.

Même ainsi, Ty, pendant l’entretien téléphonique, n’a pas pu cacher complètement une tremblement d’émotion. Quand il venait de rejoindre l’entreprise et traversait une période d’adaptation difficile, il avait un moment eu l’impression qu’il n’y arriverait pas, au point même d’avoir pensé à démissionner.

Puis, lors d’une assemblée générale des employés, une semaine plus tard, il a vu Annie — une fille fraîchement diplômée depuis seulement deux ans. Après d’innombrables échecs et d’intenses doutes intérieurs, elle avait finalement réussi à faire avancer un projet difficile. En voyant ça, il s’est dit qu’il ne pouvait pas abandonner. Il était plus âgé qu’elle et avait plus d’expérience, mais sur le seul plan de la persévérance et de la volonté pure, il pensait être plus faible.

Il a dit :

« Je ne sais pas comment elle a tenu. »

En réalité, il n’y avait pas que Ty qui avait pensé à partir.

Annie aussi avait pensé à partir.

Pendant longtemps, elle a construit une ligne de business overseas de zéro à une brique, mais sans jamais parvenir à une vraie percée. Le pire, c’est que, par gentillesse, des collègues d’autres équipes lui ont directement dit d’abandonner cet effort qu’ils jugeaient sans aucun sens.

Elle a dit qu’elle pleurait chez Kimi plus que dans n’importe quelle autre entreprise, et plus que quelqu’un ne pleure pour n’importe quel ex.

Elle n’avait pas de solution de rechange. Elle avait déjà obtenu une offre avec un salaire plus élevé. Mais elle dit qu’elle n’arrivait tout simplement pas à se convaincre d’aller travailler pour quelqu’un d’autre. Elle voulait en parler encore une fois avec Zhang Yutong.

Après cela, elle a décidé de rester.

Elle ne m’a pas dit le contenu de cette conversation. Elle a seulement dit : « Yutong est le patron le plus fort que j’aie jamais vu, celui qui itère le plus vite et qui a le plafond le plus élevé. Rester à ses côtés est ma façon de relever mon plafond. »

Puis Annie a répété exactement la même phrase :

« Je ne sais pas comment elle a tenu. »

Quand tu accumules suffisamment de matière, tu découvres que certaines phrases reviennent sans cesse. Et les phrases les plus souvent répétées révèlent en général une qualité commune profonde au sein d’une équipe.

Bob, rappelé des États-Unis par Yang Zhilin — ayant renoncé à l’opportunité de faire un doctorat aux États-Unis — et qui avait rejoint l’entreprise dès le premier jour de sa création. Si quelqu’un comprend profondément cette société, c’est lui.

Quand je lui ai posé la question que tout le monde lui pose — quelle est la qualité la plus importante pour cette équipe — il a réfléchi pendant environ deux minutes, puis il a répondu avec un seul mot :

Résilience.

Pour une entreprise qui n’a que trois ans d’existence, parler de résilience peut sembler un peu prétentieux. Mais il parlait sérieusement. Il dit que l’intelligence et le courage sont parfois opposés. Plus on est intelligent, plus on voit clairement les risques, et plus on est susceptible de partir. Persister aveuglément ne mène pas au succès. Ainsi, seule la capacité de voir la vérité, de calculer les probabilités d’échec, tout en continuant quand même, mérite le nom de résilience.

En interne, il existe une histoire appelée « l’escalade de l’abrupt des trois ascensions » (« 三上绝壁 »).

En mai 2023, Freddie et ses collègues ont reçu une mission qui semblait impossible : faire que l’IA lise et comprenne un contexte de 128K d’un seul coup — l’équivalent de plusieurs centaines de pages — alors que les standards de l’industrie étaient encore autour de 4K.

Il a rapidement conçu une solution appelée MoBA v0.5, mais cela nécessitait de réécrire le framework d’entraînement au moment où le modèle principal en était à la moitié de son entraînement. Le coût était trop élevé, et le plan a été mis de côté. C’était la première fois « d’affronter l’abrupt ».

Six mois plus tard, il est revenu avec v1. Cette version permettait de continuer à entraîner à partir des modèles existants. Sur les petits modèles, tout a fonctionné ; mais lors des tests sur les grands modèles, une hausse brutale de loss (loss spike) est apparue, et le système a échoué à répétition. Le projet a dû reculer une deuxième fois, encore six mois. Même en ratant le moment clé du jalon produit de 200 000 caractères de l’entreprise. Pourtant, l’équipe n’a pas été dissoute : elle a au contraire lancé une « opération de sauvetage par saturation » — en mobilisant des experts techniques venus de partout pour se concentrer sur la résolution du problème. Ils ont réécrit la logique centrale, et v2 a finalement passé le test classique des longs textes « à la recherche d’une aiguille dans une botte de foin ».

Juste au moment où on pensait que la mise en ligne était imminente, la troisième attaque est arrivée. Pendant le fine-tuning supervisé, le modèle a montré de très mauvaises performances sur les tâches de résumé de longs textes, car les signaux d’entraînement étaient trop clairsemés. À ce moment-là, une grande quantité de ressources avait déjà été engagée. Les ingénieurs sont retournés une nouvelle fois « affronter l’abrupt », cherchant une solution. Finalement, ils ont résolu le problème en modifiant les mécanismes d’attention sur les dernières couches.

Trois fois reculer, trois fois revenir.

À la fin de l’entretien, je lui ai posé la question ultime : comment décrirais-tu cette entreprise ?

Il a répondu en deux mots :

Atteindre la Lune.

Pourquoi « atteindre la Lune » ?

Il a cité la phrase célèbre de Kennedy :

« Nous choisissons d’aller sur la Lune dans cette décennie, non pas parce que c’est facile, mais parce que c’est difficile. »

Tous les salles de réunion de l’entreprise sont nommées comme des groupes de musique.

Essaim de génies

Finalement, je n’ai pas dérangé, ni essayé d’enquêter plus profondément, directement sur les cofondateurs eux-mêmes.

En externe, ils sont presque invisibles. Ils n’aiment pas accepter des interviews, et n’ont aucun intérêt pour la notoriété personnelle. Mais en interne, ils sont partout.

Dans une organisation extrêmement plate, tu as besoin d’un cerveau central ultra-puissant. Sinon, l’énergie devient chaos. Comme il n’y a presque pas de management intermédiaire, chaque cofondateur est en contact direct avec environ 40 à 50 employés, tout en restant aux avant-postes, à la fois techniques et business. C’est ainsi que l’entreprise maintient l’alignement entre la décision et l’exécution.

Les cinq cofondateurs viennent tous de Tsinghua. Mais il existe toujours des limites physiologiques. La bande passante de l’attention humaine est limitée, et le rayon de management l’est aussi. Une fois que la valorisation a dépassé 120 milliards de yuans et que le nombre d’employés a dépassé 300, même ces cerveaux surpuissants commencent à subir la pression.

Pas seulement les fondateurs.

C’est un jeu infini porté par la motivation intrinsèque. Si chacun porte réellement une valorisation de 400 millions, alors la valeur qu’on attend de chacun à créer est aussi extraordinaire.

La variable révolutionnaire, ce sont les outils.

En réalité, Kimi ne fonctionne pas grâce à des heures de travail extrêmes. Les employés peuvent se réveiller naturellement, sans exiger qu’ils restent au bureau jusqu’à l’aube chaque soir. Leo de l’équipe produit a dit qu’il dirige maintenant une « armée » — des agents IA.

Imaginez une scène comme celle-ci :

À 10 heures du matin, Leo se réveille et entre au bureau. Sa tâche est d’analyser les retours utilisateurs des 24 dernières heures provenant de cinq marchés mondiaux, puis de décider les priorités produit de la semaine. Dans le passé, cela demandait trois personnes pendant deux jours.

Maintenant, il lance trois agents.

Un agent de stratégie scanne 3000 retours, sélectionne les demandes à haute priorité liées aux coupures avec les longs textes. Un agent de traduction interprète en temps réel des dialectes japonais et les marques de politesse en coréen, et étiquette la force réelle des émotions. Un agent de concurrence surveille les mises à jour de Cursor et de ChatGPT, puis génère des comparatifs techniques.

Leo ne fait lui-même que trois choses : rejeter une satire qu’un système a mal jugée comme étant sincère ; marquer une capture d’écran qui contient une UI non publiée ; confirmer les trois premières demandes recommandées par les agents.

À 11h30 du matin, le document des exigences produit est déjà terminé. Dans le même temps, un agent de programmation a déjà généré environ 70 % de l’implémentation de base, ne laissant à l’après-midi que la partie plus créative à discuter avec des ingénieurs humains.

Les humains posent les règles, et le système sur silicium exécute. L’organisation devient un conteneur d’algorithmes.

Dans une entreprise native de l’IA, savoir utiliser les agents et les intégrer profondément dans le flux de travail n’est pas un bonus : c’est une exigence fondamentale.

Le modèle n’est pas seulement un objectif : c’est aussi un outil.

Que ce soit pour améliorer directement la productivité, ou changer structurellement le management, la logique de l’IA est déjà entrée dans les os de cette société. Comme l’entreprise construit un Agent Swarm (essaim d’agents intelligents), l’équipe elle-même commence aussi à devenir un Genius Swarm (essaim de génies) : de nombreux génies indépendants fonctionnent en parallèle, avec une coordination sans faille.

Cependant, cette structure plate a une fragilité intrinsèque.

Quand je demande si ce modèle peut survivre si l’entreprise passe de 300 à 3000 personnes, la plupart des réponses sont prudentes. L’histoire n’est pas très optimiste. Des expériences de plate-forme extrême comme l’holacracy ou « unification des valeurs chez Haier » — tendent à rencontrer un goulot de décision vers 500 personnes et plus. Le nombre de nœuds d’information devient trop élevé : « communication directe » se transforme en surcharge d’informations.

Le problème le plus proche et le plus douloureux, c’est le sentiment de perte de poids personnel.

Sans hiérarchie pour amortir l’incertitude, la confusion sur l’orientation se transmet directement à chacun. Un ancien employé revenu à une grande entreprise l’a dit franchement : sans OKR et KPI décidés du haut, certains matins, tu entres au bureau sans savoir quoi faire. Personne ne te dira forcément si tu fais bien ou mal. Cet état de manque de feedback crée de l’insécurité. Il te fait regretter le reporting clair et les points de contrôle, ainsi que la production quantifiable dans les grandes entreprises.

Ces structures fastidieuses offrent finalement une chose : une limite de certitude.

Où sont les objectifs ? Qu’est-ce qui compte comme fini ? Comment évalue-t-on la performance ? Dans une grande entreprise, tout cela se voit.

Cette personne a dit : ce n’est pas un syndrome de Stockholm, mais une sorte de physique organisationnelle de base.

Si Ali ressemble à un tapis roulant d’avancement minutieusement calibré, ByteDance à une armée de combat agressive à objectifs, Tencent à un institut de formation professionnelle plus tolérant, alors le côté obscur de la Lune ressemble à une forêt primitive.

Les génies trouveront peut-être des chemins de chasse. Les gens ordinaires ne font que dériver dans le brouillard.

La « lame à二向箔 » nécessaire

Pas de départements, pas de title, pas d’évaluations.

Ce modèle d’organisation native de l’IA est anti-bureaucratique et volontairement désorganisé. Les grandes entreprises ont déjà du mal à basculer vers ce modèle ; les petites entreprises, elles, ratent souvent la fenêtre, parce qu’elles se transforment en architecture traditionnelle trop tôt. C’est une guerre asymétrique.

Ici, l’auteur cite un concept classique du roman « Le Problème à Trois Corps ». Dans cette histoire, une civilisation avancée utilise d’un geste une arme appelée « 二向箔 » (la lame bidimensionnelle), qui fait s’effondrer le système solaire de la troisième dimension vers la deuxième. Les planètes, les étoiles et l’humanité deviennent une simple image plane sans épaisseur.

L’auteur pense que le côté obscur de la Lune jette activement une telle « lame à二向箔 » sur lui-même.

Non pas pour éliminer l’adversaire, mais pour aplatir l’organisation, dans la quête d’une efficacité maximale.

Pas de profondeur verticale sans hiérarchie, pas de murs transversaux sans départements, pas d’enchevêtrement tridimensionnel de politique de bureau. Il n’y a que « le modèle » et « l’intelligence » qui se font directement face, sous la forme la plus simple.

À l’ère de l’IA, chaque startup est forcée de jeter une telle lame bidimensionnelle sur elle-même. La montée des entreprises composées d’une seule personne reflète aussi l’explosion générationnelle des talents natifs de l’IA. Si la technologie peut comprimer la capacité organisationnelle au niveau de l’individu, alors la couche intermédiaire du management va largement s’évaporer. L’organisation est aplatie. Pas de profondeur qui contourne. Tout le monde est forcé de faire face au problème lui-même.

C’est peut-être une règle dure de la façon dont les organisations évoluent dans le monde des affaires.

Finalement, chacun sera replié.

Une fois que les gens se retrouvent exposés sur le même plan, l’influence d’une personne sur cinquante autres n’est plus un miracle de management : cela devient une normalité. La distance du centre à la périphérie est redéfinie. Ceux qui comptent sur title et OKR comme coordonnées risquent d’étouffer instantanément. Mais sur ce plan exposé, les génies peuvent démanteler violemment l’intelligence elle-même ; et les « gardiens » éliminent le bruit et l’augmentation de l’entropie, se voyant comme des pionniers élargissant les frontières de la civilisation humaine, non sans humilité.

Pourtant, la transition de la troisième dimension à la deuxième est irréversible.

Cela signifie que Kimi ne peut pas revenir en arrière.

Chaque ajustement de stratégie devient une itération chaotique à haut risque. Les adversaires peuvent encore tourner tranquillement dans le labyrinthe, mais si le côté obscur de la Lune tente de grossir imprudemment son échelle, il risque de se déchirer structurellement. Cette « auto-réduction de dimension » peut être acceptée seulement parce qu’elle sert un objectif plus radical.

Le point final de la réduction des dimensions organisationnelles, c’est l’élévation des dimensions de l’intelligence.

Ce n’est que lorsque l’intelligence des modèles franchit un seuil critique, assez haut pour s’extraire de toute force d’attraction des organisations basées sur le carbone, que le côté obscur de la Lune pourra vraiment écraser l’avantage organisationnel des concurrents et prouver que ce pari irréversible était juste.

Alors, les débats sur le rayon de management ou l’architecture organisationnelle n’auront plus d’importance. C’est comme demander à quelle dimension se trouve réellement la civilisation des Trois Corps : le véritable enjeu est que son arme de réduction dimensionnelle a déjà réécrit les règles de la guerre.

Alors, « le côté obscur de la Lune » ne sera plus une métaphore.

Il deviendra une source lumineuse de haute dimension, illuminant l’envers de l’univers de l’intelligence. Jusque-là, toutes les douleurs organisationnelles n’étaient que la couche d’isolation thermique brûlée quand la capsule d’atterrissage traverse l’atmosphère.

Soit devenir un dieu dans l’ascension,

soit être scellé dans l’effondrement.

Il n’y a pas de troisième voie.

Tous les noms en anglais dans le texte sont des pseudonymes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler