Le modèle utilise rg et fait souvent des erreurs, le taux d'erreur est d'environ 10 %. Le problème vient du fait que le traitement de -rn par rg n'est pas cohérent avec grep, et le modèle est plus familier avec grep, donc il fait souvent des erreurs. À l'ère de l'IA, lorsque de nouveaux outils remplacent les anciens, ils devraient accepter de manière transparente toutes les entrées des anciens outils, en particulier ceux que les LLM connaissent bien.

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

06-25 00:19

L'abonnement à GPT a été annulé de manière inexpliquée par Google Play, et il semble qu'il n'y ait plus d'entrée d'abonnement sur la version Android de GPT ? Quelqu'un a-t-il rencontré un problème similaire ?

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

06-19 06:46

holon v0.19.0 a été publié
Cette version intègre une interface web (Web UI) et a également refondu le système de stockage sous-jacent, le système API et le système d'événements, en comblant de nombreux trous laissés par l'IA.
Auparavant, on utilisait JSONL, mais lorsque la quantité de données est devenue importante, la maintenance est devenue difficile.
En ajoutant aux habitudes de programmation de l'IA, qui consiste à grep puis à ajouter si ce n'est pas trouvé, cela a conduit à de nombreux doublons dans les API et les événements.
Donc, tout a été transféré dans une base de données SQL

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

06-03 01:06

Le jeton de l'appareil Codex demande soudainement une vérification du numéro de téléphone pour la connexion ? Et en plus, vous ne trouvez pas le numéro de téléphone OpenAI dans les paramètres du compte ? Il semble qu'il n'y ait aucun endroit pour le modifier.

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

05-27 00:53

Agent需要什么样的基础工具集合
看到大家在聊Agent工具集的问题——是不是提供一个shell就都搞定了？做了holon之后发现，其实没有那么简单。
读：为什么放弃了Read/Glob，全走shell
holon的工具集改了几个版本，最后废弃了类似Claude Code提供的Read（读文件）、Glob（模式搜索）这类专用工具，读取和查找全部通过shell来完成。这和Codex的路线一致——Codex的ExecCommand一把梭，读文件就是cat，搜代码就是rg，不再单独给每种"读"操作定义一个工具。
这样做的理由很朴素：shell是LLM最熟悉的"编程语言"。与其让模型去学你定义的Read工具的参数语义，不如直接让它写已经训练了几十亿次的shell命令。每多一个专用工具，模型的认知负担就加一层；而shell这个界面，模型已经足够熟练了。
但全走shell有一个代价：输出截断。框架为了避免shell返回值太长撑爆上下文，会给每个命令设输出上限。Agent用cat读一个大文件，可能只拿到前半截，剩下的在artifact文件里，还得再cat一次甚至多次才能读完。Claude Code的Read工具压缩阈值比通用shell高很多，读大文件一步到位，少了好几个来回。本质上是取舍：少定义工具降低认知负担，但专用工具在边界场景效率更高。
写：从sed到ApplyP

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

05-08 15:29

Attribuez une étape à la planification Codex, puis continuez à y ajouter des issues, il continuera à travailler. Dommage que ma vitesse d'ajout ne puisse pas suivre la vitesse à laquelle il réalise 😅

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

05-03 07:24

Après avoir beaucoup échangé avec GPT, je me suis aussi habitué à utiliser le mot « clôturer ». Après avoir terminé certaines tâches, mais qu'il reste encore quelques petites choses à faire, lui dire de « clôturer » le reste des affaires, ça me paraît très naturel. J’ai oublié comment je m’exprimais avant de commencer à utiliser le mot « clôturer » 😅.

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

05-01 01:53

Comment ces termes sont-ils intégrés ? Bien que GPT 5.5 soit déjà très performant, l'apparition de ce genre de problème remet toujours en question sa fiabilité😅

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-28 06:24

La limite hebdomadaire de Codex Plus approche, plusieurs fenêtres ouvertes depuis longtemps ont fait que iTerm a occupé plusieurs dizaines de Go de mémoire, le disque a aussi été saturé par le worktree créé par l'Agent, et la fenêtre de nettoyage ne cesse de s'afficher.
J'ai donc été contraint de redémarrer mon ordinateur, j'ai lancé un Codex pour libérer de l'espace disque, et je prévoyais de prendre une pause.
Mais j'ai découvert que Codex a réinitialisé la limite !!😅

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-27 14:54

À l'ère de la programmation assistée par l'IA, de bonnes habitudes de codage restent importantes
Récemment, en réalisant un benchmark d'Agent, j'ai constaté qu'il ne fallait pas simplement évaluer la complexité d'une tâche de programmation du point de vue du développeur pour l'IA.
Par exemple, une tâche de refactorisation : diviser un gros fichier de plusieurs milliers de lignes en une dizaine de petits modules selon leur fonctionnalité.
Cette tâche n'est pas vraiment difficile pour un développeur, le travail principal étant de déplacer du code, d'organiser les imports, de compiler et de

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-24 03:26

Voir l'interaction entre deux agents PR, c'était assez intéressant.
L'agent développeur a terminé une optimisation du problème CI et a soumis une PR.
L'agent relecteur a découvert une modification de la valeur par défaut du timeout, estimant qu'elle ne correspondait pas au périmètre du problème, et a refusé.
L'agent développeur a supprimé cette valeur par défaut du timeout, mais le CI a échoué, une erreur dans un cas de test.
Il a alors modifié la durée du sleep dans le test pour que le test passe.
L'agent relecteur pense que ce test concerne le scénario d'annulation du timeout de tâ

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-21 14:47

Lorsqu'on découvre la conception de produits de type Agent avec l'IA, l'IA sous-estime souvent la capacité de l'Agent, ce qui conduit à concevoir des contraintes très codées ou basées sur des prompts, limitant la liberté de l'Agent et le rendant très rigide. Plus tard, en y réfléchissant, on s'est demandé si cela n'était pas lié au fait que les matériaux d'entraînement actuels de l'IA sont basés sur l'expérience de tout le monde avec la génération précédente d'IA ?

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-09 15:28

Faire collaborer deux agents, le développeur soumet une PR, l'architecte est responsable de la revue et de la fusion de la PR. Leur faire déclencher des actions en s'abonnant aux événements GitHub. Mais comme ils utilisent tous deux mon compte, ils pensent souvent que c'est eux qui ont envoyé, et filtrent donc. Il faut enregistrer un compte GitHub dédié pour chaque agent, à l'avenir tous les services Internet devraient offrir une fonction rapide pour créer un compte Agent. Comment faites-vous actuellement pour la collaboration multi-agent ?

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-08 13:04

Laissez Codex créer un outil pour envoyer des messages à Codex en cours d'exécution dans iTerm. L'outil est prêt, mais il ne peut que écrire dans la zone de saisie, sans pouvoir envoyer le message. J'ai essayé différentes combinaisons de concaténation de chaînes comme "\r" et autres, mais sans succès.
Ensuite, j'ai téléchargé le code source d'iTerm pour l'examiner, puis j'ai fait des recherches en ligne, et finalement j'en suis arrivé à la conclusion que ce n'était pas possible.
L'interface fournie par iTerm ne permet que d'envoyer du texte, pas d'envoyer directement des événements clavier

Voir l'original

1 J'aime

Récompense
1
Commentaire
Reposter
Partager

jolestar

04-05 04:27

UXC v0.13.1 Official Release
Cette version rassemble les mises à jour de deux versions v0.13.x, améliorant l'expérience de stabilité du Runtime pour UXC lors de l'utilisation d'outils distants.
Fonctionnalités principales :
1. Supporte la génération directe de code client TypeScript pour les capacités distantes explorées et testées en ligne de commande, permettant d'intégrer directement un code fortement typé dans l'application locale, sans avoir à réécrire la couche d'intégration client. L'IA nécessite non seulement une CLI, mais aussi une capacité d'appel de code.
2. La découverte automatiqu

Voir l'original

1 J'aime

Récompense
1
Commentaire
Reposter
Partager

jolestar

04-03 02:55

Worktree est mieux adapté comme un répertoire d'exécution ponctuel
Il y a quelque temps, la pratique courante était de préparer un worktree, puis d’ouvrir Codex / Claude Code dans ce répertoire. Parce que les modèles plus anciens ont un contexte et une mémoire limités, si l’on laisse directement le main workspace créer un worktree, il est facile, après compression du contexte, de confondre le répertoire actuel avec celui du worktree créé, ce qui peut finir par causer des confusions.
Mais cette méthode a aussi un inconvénient : elle tend à transformer le worktree en un espace de travail à long

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

jolestar

04-01 08:33

J'ai migré le blog vers mdorigin. Avec l'arrivée de l'IA, je sens que mon blog peut reprendre vie.
J'ai dit à Codex : "Selon mon contenu, recommande-moi un style de blog."
Codex m'a fourni deux versions, a ouvert deux ports, m'a permis de prévisualiser, et a expliqué ses raisons de manière convaincante.
Donc, j'ai supprimé le système de modèles intégré de mdorigin. Les modèles, c'est vraiment une relique de l'époque de l'Agent, principalement pour réduire la barrière à la modification du style.
Maintenant, avec l'Agent, il suffit de fournir des capacités d'extension. Le style du site peut être

Voir l'original

1 J'aime

Récompense
1
Commentaire
Reposter
Partager

jolestar

03-11 03:26

Après avoir remplacé le modèle d'OpenClaw par gpt-5.4, ses capacités se sont effectivement renforcées, mais il est un peu verbeux, aime faire de longues dissertations, je ne peux plus le supporter😅.

Voir l'original

2 J'aime

Récompense
2
Commentaire
Reposter
Partager

jolestar

03-05 00:33

Google a lancé workspace cli, prenant en charge Drive, Gmail, Calendar et toutes les API workspace.
J'ai regardé, la logique d'implémentation est similaire à uxc, c'est-à-dire qu'elle utilise un fichier schema pour générer les commandes à l'exécution.
npm install -g @googleworkspace/cli
Est-ce qu'Apple va sortir un CLI pour l'écosystème Apple ?

Voir l'original

Récompense
J'aime
Commentaire
Reposter
Partager

Sujets populaires
Afficher plus
#
PreIPOsSeason2OpenAISubscription
1,39M Popularité
#
GateDEXIntegratesWithRobinhoodChain
767,5K Popularité
#
IsraelStrikesIranBTCPlunges
72,4K Popularité
#
TSMCQ2NetProfitSurges77%
266,88K Popularité
#
SummerCreationCamp
1,04M Popularité

Épinglé

jolestar

Sujets populaires

PreIPOsSeason2OpenAISubscription

GateDEXIntegratesWithRobinhoodChain

IsraelStrikesIranBTCPlunges

TSMCQ2NetProfitSurges77%

SummerCreationCamp

Épinglé