El profesor de Wharton destaca un modelo de lenguaje de la era victoriana entrenado con 28,000 textos del siglo XIX

robot
Generación de resúmenes en curso

Titular

El profesor de Wharton comparte un modelo lingüístico victoriano y se pregunta sobre otras épocas históricas

Resumen

Ethan Mollick, profesor de Wharton que escribe con frecuencia sobre IA, tuiteó sobre “Mr. Chatterbox”: un modelo de lenguaje entrenado desde cero con más de 28.000 textos británicos de la era victoriana de 1837 a 1899. El modelo de 340 millones de parámetros, alojado en Hugging Face, intenta simular la conversación del siglo XIX sin ningún dato de entrenamiento moderno. Trip Venturella lo construyó usando nanochat para el entrenamiento y fine-tuning supervisado. La pregunta de Mollick: ¿podría funcionar este enfoque para el Renacimiento o la Ilustración si existen suficientes textos digitalizados?

Análisis

Entrenar solo con textos de la British Library significa que Mr. Chatterbox evita sesgos modernos, pero hereda los victorianos. Los comentarios de Reddit y GitHub que saqué muestran una recepción mixta: los usuarios lo encuentran entretenido para la inmersión de época, pero señalan que confiadamente se equivoca con los datos, como atribuir mal autores o afirmar tiempos de viaje incorrectos. Un comentarista llamó a las respuestas “raras” pero con encanto.

El proyecto encaja en un patrón más amplio de modelos pequeños y especializados de código abierto que abren nichos que los grandes sistemas propietarios no atienden bien. Un modelo que realmente suene victoriano tiene aplicaciones obvias en educación y escritura creativa, aunque no puedas confiar en sus datos.

El interés de Mollick tiene sentido dado su enfoque en la adopción práctica de IA. Si surgen proyectos similares para otras épocas depende de encontrar suficientes textos digitalizados de dominio público: una limitación real. El estado beta del modelo y las críticas de la comunidad sugieren que todavía queda trabajo por hacer en confiabilidad.

Evaluación de impacto

  • Significancia: Media
  • Categorías: Investigación en IA, Código abierto, Perspectiva técnica
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado