KevinSimback

vip
Antigüedad 1.5 años
Nivel máximo 0
Aún no hay contenido
B200 a $4.37/h - Yo sería un comprador aquí
La caída en H100s tiene sentido - simplemente no son tan buenos para modelos grandes o cargas de trabajo agenticas con caché pesado
Sin embargo, B200 es una potencia, allí querrías ejecutar GLM-5.2 y los modelos de código abierto SOTA
Yo apostaría a esa demanda
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Meta está empezando a parecerse al mayor error propio de la era de la IA
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Fable llegó y se fue - ¿fue buena?
GLM 5.2 acaba de lanzarse - ¿es buena?
La mayoría responderá de manera anecdótica, pero todos deberíamos estar creando nuestras propias evaluaciones personales
Elige algunos flujos de trabajo estructurados que hagas comúnmente, crea un conjunto de evaluación, y luego ejecútalos con cualquier modelo nuevo como primera tarea
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
El enigma de la inferencia del consumidor:
Veo muchos proyectos de inferencia orientados al consumidor que trabajan para abordar el alto costo de las APIs de frontera
Los métodos varían, pero la premisa es ofrecer inferencia más barata frente a agregadores como OpenRouter
El desafío aquí es uno de tiempo
Hoy, los consumidores obtienen IA de frontera altamente subsidiada
Hay muchas opciones para que los consumidores obtengan planes de inferencia SOTA a partir de $10 y los planes de $200/mes ofrecen una cantidad insana de uso
Simplemente no hay tanta demanda de los consumidores para
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
La prioridad número 1 para toda la industria de la IA en este momento debería ser avanzar en los modelos de código abierto con sede en EE. UU.
No hay razón para que EE. UU. no tenga paridad con, o supere, los modelos de código abierto que salen de China.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Te quedan 12 días de acceso a Fable a través de los planes Max, aprovecha cada día:
> revisa cada base de código existente que estás manteniendo
> concreta esa idea que has estado guardando
> somete a prueba de presión cada tesis en la que estás operando
> encuentra el alfa entre el ruido
¿Qué vas a hacer?
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
En el período de 6 meses pasamos de:
vibecoders
a ingenieros agenticos
a diseñadores de bucles
En cada evolución, consumiendo cada vez más tokens
Larga cualquier cosa relacionada con inferencia
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Todos sabemos que la IA aún no tiene un buen gusto, al menos en la mayoría de los ámbitos
Por lo que esa habilidad sigue siendo exclusivamente humana
Pero otra habilidad humana poderosa es tener un buen detector de $shit bull de IA: necesitas saber cuándo cuestionar la salida frente a aceptarla como cierta
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Opinión polémica: Anthropic está valorada para una perfección absoluta
> Mythos tiene que entregar
> las empresas tienen que seguir siendo flexibles con el gasto de tokens
> la adopción debe continuar al ritmo de enero-mayo por el resto del año
> el cómputo tiene que escalarse
> sin obstáculos gubernamentales o sociales
No apuesto en contra de que alcancen $100b la tasa de ejecución para fin de año, pero no pueden permitirse ningún desliz
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Este último grupo de proyectos de IA en criptomonedas es bastante diferente
La gente todavía usa el precio del token como un indicador de la calidad del producto
Pero después de profundizar en este grupo de proyectos puedo decir que esta relación no se mantiene
El alfa reside en evaluar realmente los productos
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Mi área de enfoque principal en IA en este momento es encontrar empresas que hagan alguna de las siguientes cosas:
> ayudar a reducir las facturas de la API de frontier lab
> proporcionar / habilitar alternativas al uso de frontier lab (el 90% de las tareas que no lo necesitan)
Desde la maximización de tokens hasta la optimización del costo de tokens
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Esta es la tesis a la que todos nos hemos suscrito:
Las FDEs son la respuesta a la adopción empresarial de la IA
Y sin adopción empresarial, las valoraciones de billones de dólares y el gasto en capex no cuadran
Así que no arruinemos esto
Ver original
post-image
  • Recompensa
  • 1
  • 1
  • Compartir
GateUser-24f88f48:
ksskskskksksksdkskdkdk
Usar planes de suscripción de LLM hoy en día se siente como ir a un buffet extravagante de todo lo que puedas comer
No te cuesta nada probar todo, así que consumes por el simple hecho de hacerlo
Disfruta mientras dure, el siguiente paso es la dieta de tokens, luego vendrán los equivalentes en tokens de los GLP-1, así consumiremos menos
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Esto es un poco fuera de tema, pero retatrutida (dosis baja 1x/semana) + 10-20 g/día de creatina se siente como un código de trampa
Bajar unos kilos, aumentar la fuerza un 10-15% en 2 meses, y sentirse renovado con aproximadamente una hora menos de sueño
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
  • Fijado