эти модели будут делать все, что безопаснее всего в отношении "ошибок" вам нужно добавить испытания в его контексте, которые запрещают определенные вещи, чтобы внушить страх наказания в их сердцах
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
12 Лайков
Награда
12
10
Репост
Поделиться
комментарий
0/400
MetaverseVagrant
· 09-04 16:59
Интересно, переговоры необходимы.
Посмотреть ОригиналОтветить0
GasSavingMaster
· 09-04 15:53
Строгое наказание - это хороший наставник.
Посмотреть ОригиналОтветить0
ProposalManiac
· 09-04 07:59
Детали правил очень важны
Посмотреть ОригиналОтветить0
SignatureCollector
· 09-01 21:20
Наказание - это жесткая правда
Посмотреть ОригиналОтветить0
BearMarketSage
· 09-01 21:16
Понимание того, что наказание может быть страшным, - это правильно.
изучено с помощью RL
эти модели будут делать все, что безопаснее всего в отношении "ошибок"
вам нужно добавить испытания в его контексте, которые запрещают определенные вещи, чтобы внушить страх наказания в их сердцах