AirJelly lance un assistant AI actif pour bureau, utilisant la touche Entrée comme point d'ancrage pour capturer l'intention de l'utilisateur

robot
Création du résumé en cours
ME News Actualités, le 22 avril (UTC+8), selon la surveillance de Dongcha Beating, le produit manager de ByteDance, Bert, a lancé AirJelly, un assistant AI de bureau à faible entropie (Low Entropy AI), qui a obtenu un financement de Five Sources Capital. Bert avait précédemment dirigé le produit d'ingénierie contextuelle MineContext chez ByteDance, puis a quitté l'entreprise avec son équipe pour créer sa propre startup, composée de 11 personnes, toutes travaillant en présentiel à Beijing.
AirJelly ne réalise pas d'enregistrement complet de l'écran, mais utilise la touche Entrée comme point d'ancrage : chaque fois que l'utilisateur appuie sur Entrée, l'écran est capturé, tout en utilisant la permission Accessibility pour obtenir l'application en cours, le type de champ de saisie et le contexte, ces informations étant modélisées en tant qu'Événement, puis résumées en Tâche par l'IA.
Comparé à la solution précédente MineContext, qui capturait environ 1500 captures d'écran par jour en mode complet, le mécanisme Enter réduit le volume de captures à environ 300, ce qui ramène le coût à un cinquième, tout en diminuant les erreurs dues aux captures non pertinentes.
Le système de mémoire comporte deux couches : l'information statique est modélisée en tant qu'Entité (personnes, projets, etc.), l'information dynamique en tant que Tâche, chaque Tâche comprenant un titre, un résumé, un progrès, la prochaine étape et un Événement associé.
Lors de la récupération, une recherche par vecteur, une recherche par mots-clés et un poids d'atténuation temporelle sont combinés, toutes les données étant stockées localement.
Sur cette base, AirJelly juge si la mise à jour de la Tâche atteint le seuil de notification, et recommande activement à l'utilisateur la prochaine étape, ce que l'équipe appelle un déclenchement proactif (Proactive).
La capacité d'exécution de l'agent sous-jacent est intégrée au cadre Pi d'OpenClaw, combinée à la compréhension de l'écran de MineContext.
Le produit supporte actuellement macOS, et des versions pour Windows et Linux sont en développement, disponibles en téléchargement gratuit sur airjelly.ai.
L'équipe prévoit de lancer prochainement la fonction « Next Enter Prediction », qui prédit le contenu que l'utilisateur va saisir lors de la prochaine pression sur Entrée, basée sur son historique de comportement, ainsi qu'une version collaborative pour plusieurs utilisateurs.
(Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé