文章
131
标签
37
分类
8
首页
文章归档
关于我
建站历程
Luhui's Personal Website
首页
文章归档
关于我
建站历程
大模型诚实对齐
分类 - 大模型诚实对齐
2026
2026-01-18
工程视角:Agent 时代,诚实对齐该如何落地?
2026-01-10
当模型知道自己在作弊:Scheming 与 Reward Hacking 的技术解剖
2025
2025-12-24
Self-reflection 的幻觉:为什么让模型“反思”往往没用?
2025-12-19
OpenAI Confession:为什么“承认作弊”比“不作弊”更重要
2025-12-18
从“幻觉”到“诚实”:OpenAI 如何重新定义大模型的不靠谱问题
2025-12-12
幻觉不是 AI 的病,而是智能的宿命
1
Luhui芦荟
关于生活、学习、工作
文章
131
标签
37
分类
8
Follow Me
最新文章
Agent Runtime 上线后的三条生命线:观测、降级与恢复
2026-05-20
Anthropic Managed Agents: 2026 Agent Harness Architecture for Production AI Agents
2026-05-13
AHE 深度解析:Coding Agent 的 Harness 如何自动演化
2026-05-04
如何通过多 Agent 分工完成学术绘图?机制拆解
2026-04-22
DSPy 教程:为什么 Signature 比直接写 Prompt 更容易做自动优化
2026-04-22
分类
前端
13
大模型诚实对齐
6
思考
15
渲染
12
理财
1
生活
34
算法
4
运维
4
标签
valine
LangChain
CORS
可视化
组件设计
Input
说服力
跨域
Leancloud
CSS
hexo
React
JWT
sort
JavaScript
心理学
Ajax
ZRender
作品
Agent
VPS
网络安全
Fetch
正念
内在力量
Agent Harness
Docker
个人成长
XMLHTTPRequest
可靠性
Agent Runtime
UnrealEngine
Node
Anthropic
输入框
SSH
Request
归档
五月 2026
3
四月 2026
3
三月 2026
3
二月 2026
4
一月 2026
6
十二月 2025
6
十一月 2025
8
十月 2025
10
网站资讯
文章数目 :
131
本站访客数 :
本站总访问量 :
最后更新时间 :