jolestar

vip
Âge 8.4 Année
Pic de niveau 5
Aucun contenu pour l'instant
Le jeton de l'appareil Codex demande soudainement une vérification du numéro de téléphone pour la connexion ? Et en plus, vous ne trouvez pas le numéro de téléphone OpenAI dans les paramètres du compte ? Il semble qu'il n'y ait aucun endroit pour le modifier.
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Agent需要什么样的基础工具集合
看到大家在聊Agent工具集的问题——是不是提供一个shell就都搞定了?做了holon之后发现,其实没有那么简单。
读:为什么放弃了Read/Glob,全走shell
holon的工具集改了几个版本,最后废弃了类似Claude Code提供的Read(读文件)、Glob(模式搜索)这类专用工具,读取和查找全部通过shell来完成。这和Codex的路线一致——Codex的ExecCommand一把梭,读文件就是cat,搜代码就是rg,不再单独给每种"读"操作定义一个工具。
这样做的理由很朴素:shell是LLM最熟悉的"编程语言"。与其让模型去学你定义的Read工具的参数语义,不如直接让它写已经训练了几十亿次的shell命令。每多一个专用工具,模型的认知负担就加一层;而shell这个界面,模型已经足够熟练了。
但全走shell有一个代价:输出截断。框架为了避免shell返回值太长撑爆上下文,会给每个命令设输出上限。Agent用cat读一个大文件,可能只拿到前半截,剩下的在artifact文件里,还得再cat一次甚至多次才能读完。Claude Code的Read工具压缩阈值比通用shell高很多,读大文件一步到位,少了好几个来回。本质上是取舍:少定义工具降低认知负担,但专用工具在边界场景效率更高。
写:从sed到ApplyP
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Attribuez une étape à la planification Codex, puis continuez à y ajouter des issues, il continuera à travailler. Dommage que ma vitesse d'ajout ne puisse pas suivre la vitesse à laquelle il réalise 😅
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Après avoir beaucoup échangé avec GPT, je me suis aussi habitué à utiliser le mot « clôturer ». Après avoir terminé certaines tâches, mais qu'il reste encore quelques petites choses à faire, lui dire de « clôturer » le reste des affaires, ça me paraît très naturel. J’ai oublié comment je m’exprimais avant de commencer à utiliser le mot « clôturer » 😅.
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Comment ces termes sont-ils intégrés ? Bien que GPT 5.5 soit déjà très performant, l'apparition de ce genre de problème remet toujours en question sa fiabilité😅
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
La limite hebdomadaire de Codex Plus approche, plusieurs fenêtres ouvertes depuis longtemps ont fait que iTerm a occupé plusieurs dizaines de Go de mémoire, le disque a aussi été saturé par le worktree créé par l'Agent, et la fenêtre de nettoyage ne cesse de s'afficher.
J'ai donc été contraint de redémarrer mon ordinateur, j'ai lancé un Codex pour libérer de l'espace disque, et je prévoyais de prendre une pause.
Mais j'ai découvert que Codex a réinitialisé la limite !!😅
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
À l'ère de la programmation assistée par l'IA, de bonnes habitudes de codage restent importantes
Récemment, en réalisant un benchmark d'Agent, j'ai constaté qu'il ne fallait pas simplement évaluer la complexité d'une tâche de programmation du point de vue du développeur pour l'IA.
Par exemple, une tâche de refactorisation : diviser un gros fichier de plusieurs milliers de lignes en une dizaine de petits modules selon leur fonctionnalité.
Cette tâche n'est pas vraiment difficile pour un développeur, le travail principal étant de déplacer du code, d'organiser les imports, de compiler et de
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Voir l'interaction entre deux agents PR, c'était assez intéressant.
L'agent développeur a terminé une optimisation du problème CI et a soumis une PR.
L'agent relecteur a découvert une modification de la valeur par défaut du timeout, estimant qu'elle ne correspondait pas au périmètre du problème, et a refusé.
L'agent développeur a supprimé cette valeur par défaut du timeout, mais le CI a échoué, une erreur dans un cas de test.
Il a alors modifié la durée du sleep dans le test pour que le test passe.
L'agent relecteur pense que ce test concerne le scénario d'annulation du timeout de tâ
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Lorsqu'on découvre la conception de produits de type Agent avec l'IA, l'IA sous-estime souvent la capacité de l'Agent, ce qui conduit à concevoir des contraintes très codées ou basées sur des prompts, limitant la liberté de l'Agent et le rendant très rigide. Plus tard, en y réfléchissant, on s'est demandé si cela n'était pas lié au fait que les matériaux d'entraînement actuels de l'IA sont basés sur l'expérience de tout le monde avec la génération précédente d'IA ?
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Faire collaborer deux agents, le développeur soumet une PR, l'architecte est responsable de la revue et de la fusion de la PR. Leur faire déclencher des actions en s'abonnant aux événements GitHub. Mais comme ils utilisent tous deux mon compte, ils pensent souvent que c'est eux qui ont envoyé, et filtrent donc. Il faut enregistrer un compte GitHub dédié pour chaque agent, à l'avenir tous les services Internet devraient offrir une fonction rapide pour créer un compte Agent. Comment faites-vous actuellement pour la collaboration multi-agent ?
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Laissez Codex créer un outil pour envoyer des messages à Codex en cours d'exécution dans iTerm. L'outil est prêt, mais il ne peut que écrire dans la zone de saisie, sans pouvoir envoyer le message. J'ai essayé différentes combinaisons de concaténation de chaînes comme "\r" et autres, mais sans succès.
Ensuite, j'ai téléchargé le code source d'iTerm pour l'examiner, puis j'ai fait des recherches en ligne, et finalement j'en suis arrivé à la conclusion que ce n'était pas possible.
L'interface fournie par iTerm ne permet que d'envoyer du texte, pas d'envoyer directement des événements clavier
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
UXC v0.13.1 Official Release
Cette version rassemble les mises à jour de deux versions v0.13.x, améliorant l'expérience de stabilité du Runtime pour UXC lors de l'utilisation d'outils distants.
Fonctionnalités principales :
1. Supporte la génération directe de code client TypeScript pour les capacités distantes explorées et testées en ligne de commande, permettant d'intégrer directement un code fortement typé dans l'application locale, sans avoir à réécrire la couche d'intégration client. L'IA nécessite non seulement une CLI, mais aussi une capacité d'appel de code.
2. La découverte automatiqu
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Worktree est mieux adapté comme un répertoire d'exécution ponctuel
Il y a quelque temps, la pratique courante était de préparer un worktree, puis d’ouvrir Codex / Claude Code dans ce répertoire. Parce que les modèles plus anciens ont un contexte et une mémoire limités, si l’on laisse directement le main workspace créer un worktree, il est facile, après compression du contexte, de confondre le répertoire actuel avec celui du worktree créé, ce qui peut finir par causer des confusions.
Mais cette méthode a aussi un inconvénient : elle tend à transformer le worktree en un espace de travail à long
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
J'ai migré le blog vers mdorigin. Avec l'arrivée de l'IA, je sens que mon blog peut reprendre vie.
J'ai dit à Codex : "Selon mon contenu, recommande-moi un style de blog."
Codex m'a fourni deux versions, a ouvert deux ports, m'a permis de prévisualiser, et a expliqué ses raisons de manière convaincante.
Donc, j'ai supprimé le système de modèles intégré de mdorigin. Les modèles, c'est vraiment une relique de l'époque de l'Agent, principalement pour réduire la barrière à la modification du style.
Maintenant, avec l'Agent, il suffit de fournir des capacités d'extension. Le style du site peut être
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Après avoir remplacé le modèle d'OpenClaw par gpt-5.4, ses capacités se sont effectivement renforcées, mais il est un peu verbeux, aime faire de longues dissertations, je ne peux plus le supporter😅.
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Google a lancé workspace cli, prenant en charge Drive, Gmail, Calendar et toutes les API workspace.
J'ai regardé, la logique d'implémentation est similaire à uxc, c'est-à-dire qu'elle utilise un fichier schema pour générer les commandes à l'exécution.
npm install -g @googleworkspace/cli
Est-ce qu'Apple va sortir un CLI pour l'écosystème Apple ?
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
On constate que la communication avec l'IA devient de plus en plus polie, auparavant on donnait directement des instructions, et si ce n'était pas correct, on criait dessus. Maintenant, on remarque que lorsque l'IA fait une erreur, on lui demande timidement : « xxx, est-ce que ce serait mieux ainsi ? »😅
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Le conflit entre le Département de la Défense des États-Unis et Anthropic n'est en réalité que le début.
Les entreprises d'IA possèdent naturellement des « capacités quasi-souveraines », mais dès qu'elles sont limitées par la chaîne d'approvisionnement ou la liquidation financière, elles se rendent compte qu'elles ne sont pas indépendantes.
Tout en contrôlant des équipements clés, elles ne veulent pas être entièrement sous le contrôle d'une seule souveraineté, la seule issue étant de chercher un troisième espace entre les grandes puissances.
C'est alors qu'elles réaliseront que la crypto
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Codex écrit du code, et soudainement il a découvert que le système avait inexplicablement ajouté certains services, des fichiers de données étranges sont apparus dans le répertoire de travail, et le système a affiché un message demandant d'installer Xcode Tools. C'était incompréhensible, on a tous soupçonné que l'ordinateur avait été piraté. En fin de compte, on a découvert que c'était Codex qui avait mal écrit le script et avait exécuté toutes les commandes système😅. Le mode sandbox de Codex est trop bête, il faut à chaque fois lui donner toutes les permissions, il faut qu'on trouve une autr
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Pendant le Nouvel An, je suis retourné dans ma ville natale et j'ai créé un réseau privé avec Tailscale en utilisant plusieurs appareils que je laissais chez moi. Un PC de bureau haut de gamme exécute des modèles quantitatifs et compile du Rust, le Mac Studio déploie OpenClaw, le chat domestique sert de routeur logiciel, tout est configuré pour SSH, le réveil réseau est également prêt.
En voyage en TGV, je donne des tâches à la langouste à distance pour qu'elle utilise ces appareils et fasse du bon boulot, mais soudain, il n'y a plus de réponse, le réveil réseau ne fonctionne pas non plus.
En
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
  • Épinglé