DeepSeek uji coba fitur "Mode Penglihatan Gambar", kemampuan multimodal resmi dibuka|Eksklusif

robot
Pembuatan abstrak sedang berlangsung

Berita Mars Finance 29 April, beberapa pengguna melaporkan bahwa mode “Penglihatan Gambar” telah diluncurkan di versi web DeepSeek. Setelah dicoba, mode ini mendukung pengguna mengunggah gambar dan melakukan pemahaman serta analisis konten. Saat ini, fitur ini belum sepenuhnya dirilis, batasan fungsi masih belum jelas. Yang patut dicatat adalah, hari ini, peneliti pengembangan multimodal DeepSeek, Chen Xiaokang, memposting di platform X dengan tulisan “Now, we see you” dan menyertakan gambar, di mana ikon khas DeepSeek, “ikan paus”, melepas penutup mata. Pada awal bulan ini, DeepSeek baru saja meluncurkan “Mode Cepat” dan “Mode Ahli”, yang pertama cocok untuk percakapan sehari-hari dan respons langsung; yang kedua mahir dalam masalah kompleks, membutuhkan waktu tunggu saat puncak. Saat itu, beredar screenshot yang menunjukkan bahwa selain mode “Cepat” dan “Ahli”, DeepSeek juga memiliki mode bernama “vision”. Mode “Penglihatan Gambar” terbaru sangat cocok dengan pintu masuk “vision” yang beredar sebelumnya. Analisis menunjukkan bahwa pembukaan kemampuan multimodal DeepSeek menandakan bahwa rangkaian produknya telah secara resmi memperluas dari dialog teks murni ke interaksi gambar dan teks, mendekati model multimodal utama seperti GPT-4o dan Gemini. (Pengamatan sudut lebar)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan