KevinSimback

vip
Âge 1.5 Année
Pic de niveau 0
Aucun contenu pour l'instant
Mettre un LLM comme juge est la manière la plus simple et la plus facile de créer une boucle
1. Faites ce que vous faites déjà en interrogeant l'IA
2. Utilisez un autre modèle pour évaluer la sortie et lui donner un retour
3. Itérez jusqu'à ce que les deux soient satisfaits
Ne voyez le résultat final qu'une fois la boucle terminée
Puisque vous utilisez un LLM comme juge, cela convient généralement mieux aux tâches non déterministes comme la recherche, la conception, la rédaction de spécifications, etc.
Utiliser Looper pour cela rendra la tâche très facile en affinant votre prompt pour une bouc
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
J'adore les récents débats sur la mémoire, mais voici ce que beaucoup oublient :
En l'espace d'environ 6 mois, nous sommes passés de conversations majoritairement générales à une utilisation intensive d'agents, 5 à 100 fois plus gourmande en mémoire
Et ça ne s'arrêtera pas là
La demande de cette équation est insensée
Voir l'original
post-image
  • Récompense
  • 1
  • Reposter
  • Partager
SAHEN:
nouvelle mise à jour pour aller sur la lune 🌚

mon UID une bonne journée aujourd'hui Aime les idées pour une vie meilleure est un redpack les idées je
InduitparleSSPT,situsais,tusais
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
GLM 5.2 contre Opus 4.8 contre GPT 5.5
Chez Delphi, nous sommes des utilisateurs avancés de l'IA et avons un groupe de discussion très actif pour discuter de tous les modèles et tendances.
Consensus général :
> Les 3 ont leurs bons et mauvais moments, pas de vainqueur décisif
> GLM est assez bon, comme beaucoup le suggèrent sur le fil d'actualité
> Opus reste le meilleur en conception et visualisations
> GPT est le modèle de travail le plus courant pour les tâches quotidiennes + agents
Avoir les 3 via des plans de codage subventionnés est le coup de maître
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Je viens de quitter l'Italie en pleine canicule, je ne comprends vraiment pas pourquoi la climatisation est même un sujet de débat
Littéralement tout le monde - y compris les locaux - se plaint
Être en sueur à l'intérieur rend juste les gens irritables, installez la clim enfin
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Si vous n’êtes pas aux États-Unis ou en Chine, je ne comprends pas comment vous pouvez rester à l’écart et devenir dépendants d’eux pour l’intelligence qui définira l’avenir
Vous penseriez qu’il s’agirait d’une priorité nationale d’avoir une stratégie ici
Bien sûr, plus facile à dire qu’à faire - il faut de gros investissements et des talents pour rivaliser avec les laboratoires de pointe
La première étape la plus simple est de construire des centres de données souverains et d’héberger les modèles de poids ouverts ou les versions post-entraînées - au moins vous possédez une forme d’intel
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Si vous faites une diligence sur une nouvelle startup, vous devez maintenant évaluer leur « naturalité à l’IA » en plus de l’équipe, du produit et du marché
Pourquoi ? S’ils ne sont pas à la pointe de l’utilisation de l’IA, cela les met en danger de ne pas exécuter assez rapidement
Ce n’est pas un filtre de rejet strict, mais c’est un signal - voici quelques indices précoces :
1. Leur ont-ils donné un fichier .md, en plus d’une présentation, que vous pouvez alimenter à votre LLM ?
2. Ont-ils construit une présentation HTML interactive ou ont-ils simplement envoyé un PDF/docsend ?
3.
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Si vous évaluez une nouvelle startup, vous devez maintenant juger de leur « naturalité à l’IA » en plus de l’équipe, du produit et du marché
Pourquoi ? S’ils ne sont pas à la pointe de l’utilisation de l’IA, cela les met en danger de ne pas exécuter assez rapidement
Ce n’est pas un filtre de passage strict, mais c’est un signal - voici quelques indices précoces :
1. Leur ont-ils donné un fichier .md, en plus d’une présentation, que vous pouvez alimenter à votre LLM ?
2. Ont-ils construit une présentation HTML interactive ou ont-ils simplement envoyé un PDF/docsend ?
3. Parlent-ils de
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Riddle me this :
Que se passe-t-il lorsque GLM-6 sort et possède des capacités Fable/Mythos ?
Ce n’est pas une question de si, mais de quand
Et comprendre les scénarios et les implications est incroyablement important
GLM1,02%
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Je viens de m'inscrire à un abonnement Sakana Fugu - voyons à quelle vitesse je le consomme
Difficile de ne pas l'essayer avec ces scores
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Un gros problème avec la cryptomonnaie en ce moment, c'est que vous devez supposer que chaque nouveau projet de jeton va faire un rug pull, intentionnellement ou non
Mais pour que l'IA décentralisée fonctionne, vous avez besoin de mécanismes de coordination et les jetons ont le plus de sens
Comment concilions-nous cela ?
TOKEN-0,87%
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
B200 à 4,37 $/h - Je serais acheteur ici
La baisse des H100s est logique - ils ne sont tout simplement pas aussi performants pour les grands modèles ou les charges de travail agentiques avec une forte mémoire cache
Cependant, le B200 est une centrale électrique, c’est là que vous voudriez exécuter GLM-5.2 et les modèles open source de pointe
Je miserais sur cette demande à long terme
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Meta commence à ressembler au plus grand but contre son camp de l'ère de l'IA
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Fable est venu et est reparti - était-ce bon ?
GLM 5.2 vient de sortir - est-ce bon ?
La plupart répondront de manière anecdotique, mais nous devrions tous créer nos propres évaluations personnelles
Choisissez quelques flux de travail structurés que vous faites habituellement, construisez un ensemble d'évaluation, puis exécutez-les avec n'importe quel nouveau modèle comme première tâche
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Le casse-tête de l'inférence pour le consommateur :
Je vois beaucoup de projets d'inférence orientés consommateur qui tentent de résoudre le coût élevé des API de pointe
Les méthodes varient, mais le principe est de fournir une inférence moins chère par rapport aux agrégateurs comme OpenRouter
Le défi ici concerne le timing
Aujourd'hui, les consommateurs bénéficient d'une IA de pointe fortement subventionnée
Beaucoup d'options pour que les consommateurs obtiennent des plans d'inférence SOTA à partir de 10 $ et les plans à 200 $/mois offrent une quantité incroyable d'utilisation
Il
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
La priorité numéro 1 pour toute l'industrie de l'IA en ce moment devrait être de faire progresser les modèles open source basés aux États-Unis
Il n'y a aucune raison pour que les États-Unis ne soient pas à égalité avec, ou dépassent, les modèles open source issus de Chine
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Il vous reste 12 jours d'accès à Fable via les plans Max, faites en sorte que chaque jour compte :
> passez en revue chaque code existant que vous maintenez
> concrétisez cette idée que vous gardiez en réserve
> mettez à l'épreuve chaque thèse sur laquelle vous vous appuyez
> trouvez l'alpha parmi le bruit
Que allez-vous faire ?
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
En l'espace de 6 mois, nous sommes passés de :
vibecoders
à ingénieurs agentiques
à concepteurs de boucles
À chaque évolution, consommant de plus en plus de jetons
Long tout ce qui concerne l'inférence
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
  • Épinglé