avatar
文章
115
标签
31
分类
8
首页
文章归档
关于我
建站历程
Luhui's Personal Website
首页
文章归档
关于我
建站历程

大模型诚实对齐

分类 - 大模型诚实对齐
2026
2026-01-18
工程视角:Agent 时代,诚实对齐该如何落地?
2026-01-10
当模型知道自己在作弊:Scheming 与 Reward Hacking 的技术解剖
2025
2025-12-24
Self-reflection 的幻觉:为什么让模型“反思”往往没用?
2025-12-19
OpenAI Confession:为什么“承认作弊”比“不作弊”更重要
2025-12-18
从“幻觉”到“诚实”:OpenAI 如何重新定义大模型的不靠谱问题
2025-12-12
幻觉不是 AI 的病,而是智能的宿命
1
avatar
Luhui芦荟
关于生活、学习、工作
文章
115
标签
31
分类
8
Follow Me
最新文章
工程视角:Agent 时代,诚实对齐该如何落地?2026-01-18
当模型知道自己在作弊:Scheming 与 Reward Hacking 的技术解剖2026-01-10
2025/12 Review
2025/12 Review2026-01-02
2025 开源大模型生态回顾一览2025-12-26
Self-reflection 的幻觉:为什么让模型“反思”往往没用?2025-12-24
分类
  • 前端13
  • 大模型诚实对齐6
  • 思考15
  • 渲染12
  • 理财1
  • 生活33
  • 算法4
  • 运维4
标签
VPS 跨域 输入框 UnrealEngine 内在力量 可视化 作品 JWT Input XMLHTTPRequest Leancloud ZRender React Fetch valine 组件设计 Request SSH hexo 网络安全 正念 JavaScript 说服力 心理学 CSS Node CORS Docker Ajax 个人成长 sort
归档
  • 一月 20263
  • 十二月 20256
  • 十一月 20258
  • 十月 202510
  • 九月 20254
  • 八月 20253
  • 七月 20251
  • 六月 20251
网站资讯
文章数目 :
115
本站访客数 :
本站总访问量 :
最后更新时间 :
©2020 - 2026 By Luhui芦荟
浙ICP备19010836号