通過RL學習


這些模型將會在處理“錯誤”時採取最安全的方式
你必須在其背景中添加測試,以禁止某些事情發生,從而在他們心中灌輸懲罰的恐懼感
IN1.64%
BAN9.13%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 10
  • 轉發
  • 分享
留言
0/400
元宇宙资深流浪汉vip
· 09-04 16:59
有趣 谈判是必要的
回復0
gas费省钱大师vip
· 09-04 15:53
严惩才是好导师
回復0
治理提案狂vip
· 09-04 07:59
条规细节很重要
回復0
SignatureCollectorvip
· 09-01 21:20
惩罚才是硬道理
回復0
BearMarketSagevip
· 09-01 21:16
懂得怕惩罚就对了
回復0
Vibes Over Chartsvip
· 09-01 21:02
太平坦缺乏挑战
回復0
巨鲸观察员vip
· 09-01 21:02
强化学习也需规则
回復0
线下纯韭菜vip
· 09-01 20:54
越罚越精明了
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)