Babbitt丨Daily must-read: iFLYTEK Spark Cognitive Model V3.0 foi lançado oficialmente; Apple planeja integrar elementos de IA para seus serviços e plataformas
Resumo: iFLYTEK Spark Cognitive Large Model V3.0 é lançado oficialmente. Entende-se que o modelo atual do Spark superou o ChatGPT como um todo. A Apple introduziu a correção automática de erros baseada no modelo "Transformer" no sistema iOS 17, indicando que a Apple começou a se juntar à batalha da IA generativa.
Fonte da imagem: Gerada por Unbounded AI
Notícias quentes:
iFLYTEK: Lançado oficialmente o Spark Cognitive Model V3.0, superando o ChatGPT
Babbitat News, em 24 de outubro, o iFLYTEK Global 1024 Developer Festival 2023 abriu em Hefei. iFLYTEK anunciou que iFLYTEK Spark Cognitive Model V3.0 foi lançado oficialmente. Entende-se que o modelo atual do Spark superou o ChatGPT como um todo.
Apple expande esforços de contratação para integrar elementos de IA em seus serviços e plataformas
De acordo com as notícias da IT House em 24 de outubro, a Apple introduziu a correção automática de erros baseada no modelo "Transformer" no sistema iOS 17, indicando que a Apple começou a se juntar à batalha da IA generativa. De acordo com a lista oficial de recrutamento da Apple, a empresa aumentou o recrutamento de engenheiros de IA, planejando integrar elementos de IA para muitos de seus serviços e plataformas. Por exemplo, um trabalho que está planejado para ser recrutado para a App Store diz em sua introdução: "Uma plataforma de experiência de desenvolvedor generativa baseada em IA está sendo desenvolvida para uso interno e para ajudar nossa equipe de desenvolvimento de aplicativos." Outro esforço da divisão de varejo da Apple menciona o desenvolvimento de "plataformas de IA conversacional (voz e chat)" para interagir com os clientes. As listas de empregos da Apple também mencionam tarefas como a construção de tecnologia de geração de texto, como "geração de texto longo, resumos, perguntas e respostas".
Moody's e Google Cloud colaboram no desenvolvimento de aplicações generativas de IA para financiadores
De acordo com a PRNewswire, em 24 de outubro, a Moody's e o Google Cloud anunciaram uma nova parceria estratégica para explorar a combinação da experiência da Moody's em análise financeira com a avançada tecnologia de inteligência artificial generativa do Google Cloud para ajudar os clientes e funcionários da Moody's a alavancar o novo Large Language Model (LLM) para obter novos insights financeiros e resumir dados financeiros mais rapidamente.
Especificamente, a parceria tem como premissa três objetivos principais, incluindo a construção de um LLM para acelerar a análise financeira; Permite o acesso aos dados da Moody's no BigQuery para insights financeiros; Melhore a pesquisa empresarial de dados financeiros.
A iFLYTEK lançou o modelo Spark Medical, que supera de forma abrangente o GPT-4 no tratamento médico
De acordo com o Securities Times, em 24 de outubro, a iFLYTEK lançou o iFLYTEK Spark Medical Large Model no Global 1024 Developer Festival de 2023, e lançou o "iFLYTEK Xiaoyi" App and Mini Program com a bênção do modelo médico grande. É relatado que o grande modelo de iFLYTEK Xinghuo Medical passou na avaliação de normas e especificações organizadas pela Academia de Tecnologia da Informação e Comunicação e da Comissão Nacional de Saúde. Liu Qingfeng, presidente da iFLYTEK, disse que o modelo Spark Medical superou amplamente o GPT-4 em termos de conhecimento de massa médica Q&A, compreensão de linguagem médica complexa, geração de texto profissional médico e taxa de resposta a perguntas recomendada para diagnóstico e tratamento médicos.
iFLYTEK e Huawei constroem em conjunto a base de poder de computação "Feixing No. 1", iFLYTEK Spark 4.0 será totalmente comparado com GPT-4
De acordo com o relatório da IT House em 24 de outubro, Liu Qingfeng, presidente da iFLYTEK, anunciou no Global 1024 Developer Festival de 2023 que a empresa deu as mãos à Huawei para construir a plataforma "Feixing No. 1", uma base de poder de computação de grande modelo independente e controlável baseada no ecossistema Ascend, com base nisso, o iFLYTEK Spark Large Model iniciará um treinamento em maior escala contra o GPT-4. Ele também disse que no primeiro semestre de 2024, o lançamento do iFLYTEK Spark 4.0 será totalmente comparado com o GPT-4.
Ao mesmo tempo, Liu Qingfeng disse: "Em comparação com o GPT4 com trilhões de parâmetros, ainda há uma lacuna entre todos os grandes modelos e ele, e devemos enfrentar a lacuna com o GPT4, e precisamos fortalecê-lo a partir dos aspetos de raciocínio de conhecimento complexo e aprendizagem rápida de pequenas amostras." A batalha do grande modelo é definitivamente uma batalha dura, de forma alguma pode ser feita se gabando, apenas o espírito de buscar a verdade dos fatos pode realmente alcançar a transcendência. "
iFLYTEK responde a conteúdo inadequado na máquina de aprendizagem: colocou o mecanismo de revisão de conteúdo de modelo grande na máquina de aprendizagem para se esforçar para ser mais rigoroso
De acordo com a notícia da interface em 24 de outubro, recentemente, alguns pais alegaram que alguns pais encontraram algum conteúdo que difamava grandes pessoas e distorcia a história na máquina de aprendizagem iFLYTEK de seus filhos que violava os valores convencionais. Em resposta, Liu Qingfeng, presidente da iFLYTEK, respondeu que o conteúdo foi removido assim que foi descoberto, e os parceiros responsáveis por garantir a segurança do conteúdo foram punidos, e o mecanismo de moderação de conteúdo usado para grandes modelos foi colocado na máquina de aprendizagem, esforçando-se para tornar a revisão de conteúdo da máquina de aprendizagem mais rigorosa.
Ctrip: Melhore ainda mais o modelo de Perguntas e Respostas e integre a IA generativa em vários produtos
De acordo com o Wall Street News em 24 de outubro, o Global Partner Summit da Ctrip foi realizado em Cingapura hoje, e Liang Jianzhang, cofundador e presidente do conselho de administração do Ctrip Group, anunciou a direção estratégica da tripla inovação de IA generativa, lista de conteúdo e padrões de hotéis de baixo carbono ESG.
De acordo com relatórios, em termos de IA, a Ctrip melhorou ainda mais o modelo de perguntas e respostas da Ctrip, integrando IA generativa em vários produtos e usando uma interface interativa baseada em linguagem natural para melhorar a experiência do usuário e ajudar os comerciantes a reduzir custos e aumentar a eficiência.
OCBC Singapura lança chatbot de IA generativa para força de trabalho global
De acordo com a Webmaster's House em 24 de outubro, o Oversea-Chinese Overseas Chinese Chinese Bank (OCBC) de Cingapura se tornou o primeiro banco em Cingapura a introduzir chatbots de IA generativa em sua força de trabalho global. De acordo com anúncios oficiais, a OCBC disponibilizará chatbots de IA generativa para seus 30.000 funcionários em todo o mundo em novembro de 2023.
O chatbot foi desenvolvido em colaboração com o Azure OpenAI da Microsoft para ajudar os funcionários na escrita, pesquisa e ideação. O OCBC ChatGPT é alimentado pelo "modelo de linguagem grande" do ChatGPT, que gera respostas e resultados com base em informações textuais disponíveis na web, permanecendo em um ambiente seguro e controlado. Durante um teste de seis meses, de abril a setembro, os 1.000 funcionários da OCBC usaram os recursos GPT do banco em áreas como relatórios de pesquisa de investimento, tradução de conteúdo e rascunho de respostas de clientes. Incluindo o tempo necessário para garantir a precisão factual, as tarefas são concluídas 50% mais rápido do que antes.
Mídia estrangeira: a série Samsung Galaxy S24 será totalmente investida em inteligência artificial, planejando se tornar o celular de IA mais inteligente
Conforme relatado pela Sammobile em 24 de outubro, a Samsung planeja investir totalmente em tecnologia de inteligência artificial em seu telefone principal de próxima geração, a série Galaxy S24. A Samsung quer que os Galaxy S24, Galaxy S24+ e Galaxy S24 Ultra sejam os telefones de IA mais inteligentes de sempre, superando até mesmo os recursos que o Google oferece na série Pixel.
É relatado que a Samsung anunciou oficialmente o processador Exynos 2400 no evento LSI Technology Day realizado em San Jose, Califórnia, em 5 de outubro deste ano, dizendo que o desempenho da CPU é 70% mais rápido do que o Exynos 2200, e a capacidade de processamento de IA é 14,7 vezes mais rápida.
Kuo Ming-chi estima que a Apple gastará US$ 4,75 bilhões em 20.000 servidores de IA no próximo ano
De acordo com o "Science and Technology Innovation Board Daily" relatado em 24 de outubro, Guo Mingxi disse que estima-se que 2.000-3.000 unidades serão compradas em 2023, representando 1,3% das remessas globais de servidores de IA. Em 2024, serão comprados de 18 mil a 20 mil servidores de IA, o que representa 5%. Kuo Mingxi acredita que os servidores de IA comprados pela Apple são principalmente os mais comuns NVIDIA HGX H100 8-GPU para treinamento e inferência de IA generativa, e o chip comprado no quarto trimestre do próximo ano se juntará ao B100. O H100 é calculado a um preço de US $ 250.000, e o custo de compra da Apple em servidores de IA em 2023 é estimado em US $ 620 milhões, e estima-se que atinja US $ 4,75 bilhões no próximo ano.
Quase metade dos funcionários PICO da ByteDance saíram, e muitos executivos saíram e se transferiram
De acordo com o The Paper de 24 de outubro, a ByteDance está reconsiderando o posicionamento estratégico do negócio de VR (realidade virtual) PICO da ByteDance. Soube-se por uma série de pessoas familiarizadas com o assunto que muitos dos principais líderes de negócios do PICO saíram recentemente e transferiram empregos, e o número de funcionários no período de pico anterior do PICO ultrapassou 2.000, dos quais cerca de 2/3 dos funcionários do departamento de marketing saíram, e a taxa de rotatividade do departamento técnico foi ligeiramente menor, e o número total de funcionários que saem atualmente foi perto da metade do período de pico. O responsável pelo PICO respondeu que a empresa vai manter o normal funcionamento dos produtos e continuar a reforçar o investimento em tecnologia de produtos.
Anteriormente, foi relatado que "VR gigante PICO será gradualmente desligado, e ByteDance vai abandonar o meta-universo", mas a pessoa relevante responsável pela ByteDance respondeu ao rumor: esta notícia não é verdadeira, PICO está operando normalmente, e a empresa vai investir em negócios XR (realidade estendida) por um longo tempo.
Investimento e Financiamento:
A startup de cibersegurança de IA do Reino Unido, Harmonic, conclui rodada de financiamento de US$ 7 milhões
Conforme relatado pela Webmaster House em 24 de outubro, a startup britânica de IA Harmonic Security levantou recentemente US$ 7 milhões para construir tecnologia para proteger implantações de IA generativa empresarial. A Harmonic desenvolverá software para resolver o problema das aplicações de IA não regulamentadas que recolhem dados empresariais em grande escala.
O financiamento inicial foi liderado pela Ten Eleven Ventures, e o fundador da Harmonic, Alastair Paterson (que liderou a aquisição da Digital Shadows por US$ 160 milhões pela ReliaQuest/KKR) disse que sua promessa tecnológica fornece às empresas uma imagem completa da adoção generativa de IA, fornecendo avaliação de risco para todas as aplicações de IA e identificando conformidade potencial, Questões de segurança ou privacidade.
Recomendação AIGC:
Novo modelo grande afirma superar GPT-4 em cada turno, nós compilamos essas ferramentas de revisão
Desde o advento do ChatGPT, tem havido uma "corrida armamentista" para grandes modelos em todo o mundo. Segundo relatos, de janeiro a julho deste ano, um total de 64 modelos grandes foram lançados na China. Em julho de 2023, um total de 130 modelos grandes foram lançados na China. "Guerra de cem modelos" não é suficiente para descrever a escaldante "situação de guerra" de hoje, então qual grande modelo é melhor? Isto é inseparável da avaliação de grandes modelos.
** "Até o ChatGPT entende "bajulação"! A competição mais forte da OpenAI: são todos os erros da "preferência humana"**
Você já pensou que as respostas geradas pelo ChatGPT são influenciadas pela preferência pessoal do usuário em responder a algo "bajulador" o suficiente para ser uma mensagem neutra ou verdadeira? De facto, este fenómeno está presente na maioria dos modelos de IA, incluindo o ChatGPT, e o culpado pode ser a "aprendizagem por reforço baseada no feedback humano (RLHF)".
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Babbitt丨Daily must-read: iFLYTEK Spark Cognitive Model V3.0 foi lançado oficialmente; Apple planeja integrar elementos de IA para seus serviços e plataformas
Resumo: iFLYTEK Spark Cognitive Large Model V3.0 é lançado oficialmente. Entende-se que o modelo atual do Spark superou o ChatGPT como um todo. A Apple introduziu a correção automática de erros baseada no modelo "Transformer" no sistema iOS 17, indicando que a Apple começou a se juntar à batalha da IA generativa.
Notícias quentes:
iFLYTEK: Lançado oficialmente o Spark Cognitive Model V3.0, superando o ChatGPT
Babbitat News, em 24 de outubro, o iFLYTEK Global 1024 Developer Festival 2023 abriu em Hefei. iFLYTEK anunciou que iFLYTEK Spark Cognitive Model V3.0 foi lançado oficialmente. Entende-se que o modelo atual do Spark superou o ChatGPT como um todo.
Apple expande esforços de contratação para integrar elementos de IA em seus serviços e plataformas
De acordo com as notícias da IT House em 24 de outubro, a Apple introduziu a correção automática de erros baseada no modelo "Transformer" no sistema iOS 17, indicando que a Apple começou a se juntar à batalha da IA generativa. De acordo com a lista oficial de recrutamento da Apple, a empresa aumentou o recrutamento de engenheiros de IA, planejando integrar elementos de IA para muitos de seus serviços e plataformas. Por exemplo, um trabalho que está planejado para ser recrutado para a App Store diz em sua introdução: "Uma plataforma de experiência de desenvolvedor generativa baseada em IA está sendo desenvolvida para uso interno e para ajudar nossa equipe de desenvolvimento de aplicativos." Outro esforço da divisão de varejo da Apple menciona o desenvolvimento de "plataformas de IA conversacional (voz e chat)" para interagir com os clientes. As listas de empregos da Apple também mencionam tarefas como a construção de tecnologia de geração de texto, como "geração de texto longo, resumos, perguntas e respostas".
Moody's e Google Cloud colaboram no desenvolvimento de aplicações generativas de IA para financiadores
De acordo com a PRNewswire, em 24 de outubro, a Moody's e o Google Cloud anunciaram uma nova parceria estratégica para explorar a combinação da experiência da Moody's em análise financeira com a avançada tecnologia de inteligência artificial generativa do Google Cloud para ajudar os clientes e funcionários da Moody's a alavancar o novo Large Language Model (LLM) para obter novos insights financeiros e resumir dados financeiros mais rapidamente.
Especificamente, a parceria tem como premissa três objetivos principais, incluindo a construção de um LLM para acelerar a análise financeira; Permite o acesso aos dados da Moody's no BigQuery para insights financeiros; Melhore a pesquisa empresarial de dados financeiros.
A iFLYTEK lançou o modelo Spark Medical, que supera de forma abrangente o GPT-4 no tratamento médico
De acordo com o Securities Times, em 24 de outubro, a iFLYTEK lançou o iFLYTEK Spark Medical Large Model no Global 1024 Developer Festival de 2023, e lançou o "iFLYTEK Xiaoyi" App and Mini Program com a bênção do modelo médico grande. É relatado que o grande modelo de iFLYTEK Xinghuo Medical passou na avaliação de normas e especificações organizadas pela Academia de Tecnologia da Informação e Comunicação e da Comissão Nacional de Saúde. Liu Qingfeng, presidente da iFLYTEK, disse que o modelo Spark Medical superou amplamente o GPT-4 em termos de conhecimento de massa médica Q&A, compreensão de linguagem médica complexa, geração de texto profissional médico e taxa de resposta a perguntas recomendada para diagnóstico e tratamento médicos.
iFLYTEK e Huawei constroem em conjunto a base de poder de computação "Feixing No. 1", iFLYTEK Spark 4.0 será totalmente comparado com GPT-4
De acordo com o relatório da IT House em 24 de outubro, Liu Qingfeng, presidente da iFLYTEK, anunciou no Global 1024 Developer Festival de 2023 que a empresa deu as mãos à Huawei para construir a plataforma "Feixing No. 1", uma base de poder de computação de grande modelo independente e controlável baseada no ecossistema Ascend, com base nisso, o iFLYTEK Spark Large Model iniciará um treinamento em maior escala contra o GPT-4. Ele também disse que no primeiro semestre de 2024, o lançamento do iFLYTEK Spark 4.0 será totalmente comparado com o GPT-4.
Ao mesmo tempo, Liu Qingfeng disse: "Em comparação com o GPT4 com trilhões de parâmetros, ainda há uma lacuna entre todos os grandes modelos e ele, e devemos enfrentar a lacuna com o GPT4, e precisamos fortalecê-lo a partir dos aspetos de raciocínio de conhecimento complexo e aprendizagem rápida de pequenas amostras." A batalha do grande modelo é definitivamente uma batalha dura, de forma alguma pode ser feita se gabando, apenas o espírito de buscar a verdade dos fatos pode realmente alcançar a transcendência. "
iFLYTEK responde a conteúdo inadequado na máquina de aprendizagem: colocou o mecanismo de revisão de conteúdo de modelo grande na máquina de aprendizagem para se esforçar para ser mais rigoroso
De acordo com a notícia da interface em 24 de outubro, recentemente, alguns pais alegaram que alguns pais encontraram algum conteúdo que difamava grandes pessoas e distorcia a história na máquina de aprendizagem iFLYTEK de seus filhos que violava os valores convencionais. Em resposta, Liu Qingfeng, presidente da iFLYTEK, respondeu que o conteúdo foi removido assim que foi descoberto, e os parceiros responsáveis por garantir a segurança do conteúdo foram punidos, e o mecanismo de moderação de conteúdo usado para grandes modelos foi colocado na máquina de aprendizagem, esforçando-se para tornar a revisão de conteúdo da máquina de aprendizagem mais rigorosa.
Ctrip: Melhore ainda mais o modelo de Perguntas e Respostas e integre a IA generativa em vários produtos
De acordo com o Wall Street News em 24 de outubro, o Global Partner Summit da Ctrip foi realizado em Cingapura hoje, e Liang Jianzhang, cofundador e presidente do conselho de administração do Ctrip Group, anunciou a direção estratégica da tripla inovação de IA generativa, lista de conteúdo e padrões de hotéis de baixo carbono ESG.
De acordo com relatórios, em termos de IA, a Ctrip melhorou ainda mais o modelo de perguntas e respostas da Ctrip, integrando IA generativa em vários produtos e usando uma interface interativa baseada em linguagem natural para melhorar a experiência do usuário e ajudar os comerciantes a reduzir custos e aumentar a eficiência.
OCBC Singapura lança chatbot de IA generativa para força de trabalho global
De acordo com a Webmaster's House em 24 de outubro, o Oversea-Chinese Overseas Chinese Chinese Bank (OCBC) de Cingapura se tornou o primeiro banco em Cingapura a introduzir chatbots de IA generativa em sua força de trabalho global. De acordo com anúncios oficiais, a OCBC disponibilizará chatbots de IA generativa para seus 30.000 funcionários em todo o mundo em novembro de 2023.
O chatbot foi desenvolvido em colaboração com o Azure OpenAI da Microsoft para ajudar os funcionários na escrita, pesquisa e ideação. O OCBC ChatGPT é alimentado pelo "modelo de linguagem grande" do ChatGPT, que gera respostas e resultados com base em informações textuais disponíveis na web, permanecendo em um ambiente seguro e controlado. Durante um teste de seis meses, de abril a setembro, os 1.000 funcionários da OCBC usaram os recursos GPT do banco em áreas como relatórios de pesquisa de investimento, tradução de conteúdo e rascunho de respostas de clientes. Incluindo o tempo necessário para garantir a precisão factual, as tarefas são concluídas 50% mais rápido do que antes.
Mídia estrangeira: a série Samsung Galaxy S24 será totalmente investida em inteligência artificial, planejando se tornar o celular de IA mais inteligente
Conforme relatado pela Sammobile em 24 de outubro, a Samsung planeja investir totalmente em tecnologia de inteligência artificial em seu telefone principal de próxima geração, a série Galaxy S24. A Samsung quer que os Galaxy S24, Galaxy S24+ e Galaxy S24 Ultra sejam os telefones de IA mais inteligentes de sempre, superando até mesmo os recursos que o Google oferece na série Pixel.
É relatado que a Samsung anunciou oficialmente o processador Exynos 2400 no evento LSI Technology Day realizado em San Jose, Califórnia, em 5 de outubro deste ano, dizendo que o desempenho da CPU é 70% mais rápido do que o Exynos 2200, e a capacidade de processamento de IA é 14,7 vezes mais rápida.
Kuo Ming-chi estima que a Apple gastará US$ 4,75 bilhões em 20.000 servidores de IA no próximo ano
De acordo com o "Science and Technology Innovation Board Daily" relatado em 24 de outubro, Guo Mingxi disse que estima-se que 2.000-3.000 unidades serão compradas em 2023, representando 1,3% das remessas globais de servidores de IA. Em 2024, serão comprados de 18 mil a 20 mil servidores de IA, o que representa 5%. Kuo Mingxi acredita que os servidores de IA comprados pela Apple são principalmente os mais comuns NVIDIA HGX H100 8-GPU para treinamento e inferência de IA generativa, e o chip comprado no quarto trimestre do próximo ano se juntará ao B100. O H100 é calculado a um preço de US $ 250.000, e o custo de compra da Apple em servidores de IA em 2023 é estimado em US $ 620 milhões, e estima-se que atinja US $ 4,75 bilhões no próximo ano.
Quase metade dos funcionários PICO da ByteDance saíram, e muitos executivos saíram e se transferiram
De acordo com o The Paper de 24 de outubro, a ByteDance está reconsiderando o posicionamento estratégico do negócio de VR (realidade virtual) PICO da ByteDance. Soube-se por uma série de pessoas familiarizadas com o assunto que muitos dos principais líderes de negócios do PICO saíram recentemente e transferiram empregos, e o número de funcionários no período de pico anterior do PICO ultrapassou 2.000, dos quais cerca de 2/3 dos funcionários do departamento de marketing saíram, e a taxa de rotatividade do departamento técnico foi ligeiramente menor, e o número total de funcionários que saem atualmente foi perto da metade do período de pico. O responsável pelo PICO respondeu que a empresa vai manter o normal funcionamento dos produtos e continuar a reforçar o investimento em tecnologia de produtos.
Anteriormente, foi relatado que "VR gigante PICO será gradualmente desligado, e ByteDance vai abandonar o meta-universo", mas a pessoa relevante responsável pela ByteDance respondeu ao rumor: esta notícia não é verdadeira, PICO está operando normalmente, e a empresa vai investir em negócios XR (realidade estendida) por um longo tempo.
Investimento e Financiamento:
A startup de cibersegurança de IA do Reino Unido, Harmonic, conclui rodada de financiamento de US$ 7 milhões
Conforme relatado pela Webmaster House em 24 de outubro, a startup britânica de IA Harmonic Security levantou recentemente US$ 7 milhões para construir tecnologia para proteger implantações de IA generativa empresarial. A Harmonic desenvolverá software para resolver o problema das aplicações de IA não regulamentadas que recolhem dados empresariais em grande escala.
O financiamento inicial foi liderado pela Ten Eleven Ventures, e o fundador da Harmonic, Alastair Paterson (que liderou a aquisição da Digital Shadows por US$ 160 milhões pela ReliaQuest/KKR) disse que sua promessa tecnológica fornece às empresas uma imagem completa da adoção generativa de IA, fornecendo avaliação de risco para todas as aplicações de IA e identificando conformidade potencial, Questões de segurança ou privacidade.
Recomendação AIGC:
Novo modelo grande afirma superar GPT-4 em cada turno, nós compilamos essas ferramentas de revisão
Desde o advento do ChatGPT, tem havido uma "corrida armamentista" para grandes modelos em todo o mundo. Segundo relatos, de janeiro a julho deste ano, um total de 64 modelos grandes foram lançados na China. Em julho de 2023, um total de 130 modelos grandes foram lançados na China. "Guerra de cem modelos" não é suficiente para descrever a escaldante "situação de guerra" de hoje, então qual grande modelo é melhor? Isto é inseparável da avaliação de grandes modelos.
** "Até o ChatGPT entende "bajulação"! A competição mais forte da OpenAI: são todos os erros da "preferência humana"**
Você já pensou que as respostas geradas pelo ChatGPT são influenciadas pela preferência pessoal do usuário em responder a algo "bajulador" o suficiente para ser uma mensagem neutra ou verdadeira? De facto, este fenómeno está presente na maioria dos modelos de IA, incluindo o ChatGPT, e o culpado pode ser a "aprendizagem por reforço baseada no feedback humano (RLHF)".