通过RL学习


这些模型将会在处理“错误”时采取最安全的方式
你必须在其背景中添加测试,以禁止某些事情发生,从而在他们心中灌输惩罚的恐惧感
IN2.52%
BAN6.66%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 10
  • 转发
  • 分享
评论
0/400
元宇宙资深流浪汉vip
· 09-04 16:59
有趣 谈判是必要的
回复0
gas费省钱大师vip
· 09-04 15:53
严惩才是好导师
回复0
治理提案狂vip
· 09-04 07:59
条规细节很重要
回复0
SignatureCollectorvip
· 09-01 21:20
惩罚才是硬道理
回复0
BearMarketSagevip
· 09-01 21:16
懂得怕惩罚就对了
回复0
Vibes Over Chartsvip
· 09-01 21:02
太平坦缺乏挑战
回复0
巨鲸观察员vip
· 09-01 21:02
强化学习也需规则
回复0
线下纯韭菜vip
· 09-01 20:54
越罚越精明了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)