20260617:目前有914 页
This commit is contained in:
64
raw/articles/cantor-stole-infinity-2026.md
Normal file
64
raw/articles/cantor-stole-infinity-2026.md
Normal file
@@ -0,0 +1,64 @@
|
||||
---
|
||||
title: "窃取无穷的数学家 (The Man Who Stole Infinity)"
|
||||
source: "Quanta Magazine / 环球科学 2026年6月刊"
|
||||
author: "约瑟夫·豪利特 (Joseph Howlett)"
|
||||
translator: "王祎(南开大学哲学院逻辑学博士研究生)"
|
||||
reviewer: "李娜(南开大学哲学院逻辑学教授)"
|
||||
date: 2026-06
|
||||
type: article
|
||||
tags: [数学史, 集合论, 无穷, 康托尔, 狄德金, 学术伦理]
|
||||
url: "https://mp.weixin.qq.com/s/xJwwHWAbBsS8NWiNeLbtNQ"
|
||||
original_url: "https://www.quantamagazine.org/the-man-who-stole-infinity-2026/"
|
||||
---
|
||||
|
||||
# 窃取无穷的数学家
|
||||
|
||||
> 原刊于 Quanta Magazine,原标题 "The Man Who Stole Infinity",由《环球科学》2026年6月刊翻译发表。
|
||||
|
||||
## 概述
|
||||
|
||||
1874年,格奥尔格·康托尔(Georg Cantor)发表了一篇改变数学史的论文,证明了无穷也有大小之分,开创了集合论。然而,2025年新发现的一批信件揭示:康托尔这篇里程碑式的论文隐藏了另一位数学家——里夏德·狄德金(Richard Dedekind)的关键贡献。
|
||||
|
||||
## 关键历史节点
|
||||
|
||||
### 1872年:独立而平行的突破
|
||||
康托尔和狄德金各自独立地发表了关于实数定义的论文,重新定义了数轴——证明实数构成了一个没有"缝隙"的完备连续统。
|
||||
|
||||
### 1872年夏:盖尔绍之遇
|
||||
两人在瑞士盖尔绍湖畔初次相遇,一见如故,在湖边漫步讨论数学。27岁的康托尔性格豪爽、急于发表;40岁的狄德金内敛审慎、不急求成。
|
||||
|
||||
### 1873年:合作与背叛
|
||||
康托尔在探索无穷问题时与狄德金频繁通信。狄德金回信提供了代数数可数性证明的关键简化——即代数数集合与整数集合同样大小。康托尔将其纳入自己的论文,同时加入了自己关于实数不可数的证明。
|
||||
|
||||
### 1874年:论文发表
|
||||
康托尔将论文投稿至《克雷勒杂志》(Crelle's Journal)。为避开编辑委员会中反无穷派数学家利奥波德·克罗内克尔(Leopold Kronecker)的阻挠,康托尔选择了误导性的标题,将狄德金的代数数证明作为"特洛伊木马"放在前面,将自己的实数不可数证明藏在后面。他抹去了狄德金贡献的一切痕迹。
|
||||
|
||||
### 1930年代:诺特揭露真相
|
||||
埃米·诺特(Emmy Noether)在整理狄德金遗作时发现了关键信件。狄德金在私人笔记中写道,他的两个证明"几乎一字不差地"以康托尔的名义发表。诺特和卡瓦利斯选择让信件本身说明一切,未公开指控。
|
||||
|
||||
### 2025年:失踪信件的发现
|
||||
科学记者德米安·戈斯(Demian Goos)在哈雷大学的档案中发现了被认为已遗失的狄德金1873年11月30日写给康托尔的信。这封信直接证明了狄德金的关键贡献。
|
||||
|
||||
## 核心数学内容
|
||||
|
||||
- **代数数的可数性**:狄德金证明了代数数集合与整数集合之间存在一一对应,即代数数是可数的。
|
||||
- **实数的不可数性**:康托尔证明了实数集合的元素多于整数集合,即实数不可数。
|
||||
- **无穷层级体系**:这两个结果共同奠定了"存在不同大小的无穷"这一革命性论断。
|
||||
|
||||
## 学术伦理讨论
|
||||
|
||||
- 康托尔的声誉未因此事而受损——他仍然是第一个证明实数不可数的人
|
||||
- 狄德金长期处于历史阴影中,至今无英文传记
|
||||
- "每一门科学分支都需要一位英雄,但这种故事总是谎言。"——何塞·费雷罗斯
|
||||
|
||||
## 核心概念
|
||||
|
||||
- [[georg-cantor|格奥尔格·康托尔]]
|
||||
- [[richard-dedekind|里夏德·狄德金]]
|
||||
- [[infinity-hierarchy|无穷层级体系]]
|
||||
- [[countable-uncountable-infinity|可数与不可数无穷]]
|
||||
- [[algebraic-numbers-countability|代数数的可数性]]
|
||||
- [[emmy-noether|埃米·诺特]]
|
||||
- [[leopold-kronecker|利奥波德·克罗内克尔]]
|
||||
- [[mathematical-priority-disputes|数学优先权争议]]
|
||||
- [[set-theory-history|集合论史]]
|
||||
86
raw/articles/lecun-llm-boundary-future-2026.md
Normal file
86
raw/articles/lecun-llm-boundary-future-2026.md
Normal file
@@ -0,0 +1,86 @@
|
||||
---
|
||||
title: "从LLM到世界模型:Yann LeCun的AI架构判断(Datawhale)"
|
||||
source: https://mp.weixin.qq.com/s/Zau10ioTWzhj0KOImpasNg
|
||||
authors: ["徐虎", "李盛康", "蒋银河", "黎又榛"]
|
||||
organization: Datawhale
|
||||
date: 2026-06
|
||||
type: article
|
||||
tags: [LLM, JEPA, world-model, VLA, objective-driven-AI, LeCun, representation-collapse, SIGReg, Tapestry]
|
||||
---
|
||||
|
||||
# 从LLM到世界模型:Yann LeCun的AI架构判断
|
||||
|
||||
> Datawhale DIY-LLM 开源项目拓展篇,系统梳理 LeCun 对 LLM 未来方向的判断。
|
||||
> 项目地址: https://github.com/datawhalechina/diy-llm
|
||||
|
||||
## 核心结论
|
||||
|
||||
1. **LLM不是终点,但不会消失** — 它会长期作为"语言与知识接口层"存在,是智能系统的"语言皮层",而非完整大脑。
|
||||
2. **"下一词元预测 + 规模化"很难通向通用智能** — 核心缺口:预测行动后果的能力 + 基于搜索的多步规划。
|
||||
3. **VLA在当前范式下已接近失败** — LeCun直接判断"VLA pretty much seen as a failure",核心原因是可靠性不足、数据依赖过重、泛化脆弱。
|
||||
4. **世界模型的关键不是"画出世界",而是"在抽象表征空间预测可控后果"** — 水瓶类比精准揭示了像素级预测的无效性。
|
||||
5. **JEPA的价值在于把学习目标从重建细节转向可预测的语义状态** — 成败关键在于防止表示坍缩,当前最有前景的路径是 SIGReg。
|
||||
6. **LLM本质上不安全,且在当前范式下无法根本修复** — 目标驱动AI(Objective-Driven AI)才是安全可控智能体的正确架构。
|
||||
7. **开源生态最终会赢得平台战争** — Tapestry 联邦训练机制是 LeCun 对主权AI问题的工程回应。
|
||||
8. **未来更可能是双系统分工** — LLM负责语言与知识交互,世界模型负责理解物理世界与规划行动。
|
||||
|
||||
## 全文章节
|
||||
|
||||
### 一、为什么LLM不是终点?
|
||||
- 1.1 有意义但不是正确的路线(洗车问题案例:LLM缺少物理约束建模)
|
||||
- 1.2 LLM为什么会成功?(离散token + 可计算预测目标)
|
||||
- 1.3 规模化或已触及天花板(高质量文本数据约300万亿Token,数据瓶颈2025-2030)
|
||||
|
||||
### 二、两个核心缺口
|
||||
- 缺少预测行动后果的能力
|
||||
- 缺少基于搜索的多步规划
|
||||
- 这两个缺口不能通过"打补丁"(RAG、Tool Use、CoT等)修复
|
||||
|
||||
### 三、VLA:为什么这条路走不通
|
||||
- VLA失败四个层面:可靠性、数据成本、泛化、规划
|
||||
- 产业界仍押注VLA的三个现实原因
|
||||
- VLA的适用边界(受控场景有效,无法成为通用机器人底座)
|
||||
|
||||
### 四、世界模型:核心概念与JEPA架构
|
||||
- 4.1 世界模型定义:让智能体预测自身行动后果的事物
|
||||
- 4.2 水瓶类比:为什么不能用像素级预测
|
||||
- 4.3 生成式世界模型 vs JEPA:关键分叉
|
||||
- 4.4 LeWorldModel:编码器(ViT-Tiny) + 预测器(Transformer) + SIGReg正则化
|
||||
- 4.5 工业应用:世界模型的近期价值
|
||||
|
||||
### 五、表征坍缩:JEPA最难的技术问题
|
||||
- 5.1 定义:模型找到"作弊解",所有输入映射为同一向量
|
||||
- 5.2 三条路线:对比学习、蒸馏方法(BYOL/DINO)、显式正则化(VICReg→SIGReg)
|
||||
- 5.3 SIGReg核心:Cramér-Wold定理 → 强制嵌入分布匹配各向同性高斯分布 N(0,I)
|
||||
|
||||
### 六、LLM的不安全性与目标驱动AI的出路
|
||||
- LLM本质上不安全(无法阻止幻觉、无法预测行动后果)
|
||||
- 目标驱动AI:通过优化找到最小化代价函数的行动序列,"从构造上无法违反"
|
||||
- 事前规划 vs 事后约束
|
||||
|
||||
### 七、Tapestry与主权AI
|
||||
- 信息食谱与认知主权问题
|
||||
- Tapestry联邦训练:共享参数向量而非数据
|
||||
- Sun Microsystems类比:开源终将胜出
|
||||
|
||||
### 八、多层分工的系统图景
|
||||
- LLM层(语言与知识接口)→ 世界模型层(预测与规划)→ 目标驱动决策层
|
||||
- 系统一(LLM/快速模式匹配) vs 系统二(世界模型/后果模拟)
|
||||
- 范式转变预测:2027年初共识形成
|
||||
|
||||
## 关键引用
|
||||
|
||||
- "智能不是关于预测下一个token,而是关于预测行动的后果。"
|
||||
- "大语言模型本质上是不安全的,因为它们无法预测其行动后果。"
|
||||
- "当前形式的大语言模型无法变得可靠,因为无法阻止它们幻觉。"
|
||||
- "VLA现在基本上被视为失败。"
|
||||
- "目标驱动AI从构造上就无法违反安全约束。"
|
||||
|
||||
## 参考资料
|
||||
|
||||
- LeWorldModel Paper: https://arxiv.org/abs/2603.19312
|
||||
- When Does LeJEPA Learn a World Model?: https://arxiv.org/abs/2605.26379
|
||||
- LeJEPA: Provable and Scalable SSL: https://arxiv.org/pdf/2511.08544.pdf
|
||||
- Project Tapestry: https://thealliance.ai/projects/tapestry
|
||||
- VLATest: https://dl.acm.org/doi/10.1145/3729343
|
||||
- LIBERO-Plus: https://arxiv.org/html/2510.13626v3
|
||||
32
raw/articles/pydantic-three-piece-suite-2026.md
Normal file
32
raw/articles/pydantic-three-piece-suite-2026.md
Normal file
@@ -0,0 +1,32 @@
|
||||
---
|
||||
source_url: https://mp.weixin.qq.com/s/jg6lW3ObZooBsrWTGwIcRg
|
||||
ingested: 2026-06-10
|
||||
---
|
||||
|
||||
# 用了两年 Pydantic,我只碰了三分之一
|
||||
|
||||
> 微信公众号文章 | 2026年
|
||||
> 拆解 Pydantic 生态三件套:pydantic-core (Rust 验证引擎) + Logfire (OTel 可观测) + Pydantic AI (类型安全 Agent 框架)
|
||||
|
||||
## 核心观点
|
||||
|
||||
Pydantic 不是校验库——是一个由三层组成的生态:
|
||||
1. **pydantic-core (Rust)**:校验速度 / 脱离 GIL / 多线程并发
|
||||
2. **Logfire (OTel)**:可观测性 / 成本监控 / 漂移检测
|
||||
3. **Pydantic AI**:Agent 行为约束 / 类型安全的 tool 调用
|
||||
|
||||
## 关键洞察
|
||||
|
||||
- **数据源变了**:2018 年校验的是人填的表单(错误模式稳定),2026 年校验的是 LLM 生成的 JSON(错误模式漂移)
|
||||
- **从"校验"到"可观测"**:不能只看单次报错,要看趋势——哪些字段在漂移、哪个模型输出最不稳定、token 成本是否在涨
|
||||
- **工厂质检类比**:手工抽检(V1)→ 传送带自动扫描(strict=True)→ IoT 传感器 + 实时看板(三件套全开)
|
||||
- **TypeAdapter**:同一份数据,不同严格度——API 入口用 strict,Agent 内部传递用宽松
|
||||
- **strict/forbid/frozen 三配置零成本**:不需要装新包,只改 model_config
|
||||
- **类型从"报错器"变"编译器"**:Pydantic AI 的类型系统在运行时之前就约束了 Agent 的行为空间
|
||||
- **诚实边界**:只做 API 校验 → 继续用 pydantic;排障靠 print → 加 Logfire;5+ tool Agent → 考虑 Pydantic AI
|
||||
|
||||
## 渐进路线图
|
||||
|
||||
1. 今天:所有 BaseModel 加 strict + forbid + validate_default
|
||||
2. 这周(如有 Agent):装 Logfire,4 行代码
|
||||
3. 下次新 Agent 项目:tool > 3 时用 Pydantic AI
|
||||
39
raw/articles/qifu-llm-finance-practice-2026.md
Normal file
39
raw/articles/qifu-llm-finance-practice-2026.md
Normal file
@@ -0,0 +1,39 @@
|
||||
---
|
||||
source_url: https://mp.weixin.qq.com/s/UnA-OLSc0mVqe7KyBX7yJw
|
||||
ingested: 2026-06-14
|
||||
sha256: skip
|
||||
---
|
||||
|
||||
# 金融行业大模型落地实践:从知识工程到后训练部署
|
||||
|
||||
**分享嘉宾:** 王元,奇富科技 DeepBank 算法组负责人
|
||||
**活动:** 2026 DA 上海站
|
||||
**出品社区:** DataFun
|
||||
**校对:** 韩珊珊
|
||||
|
||||
## 全文摘要
|
||||
|
||||
金融行业是大模型落地的"深水区":业务逻辑复杂、数据合规严格、算力预算有限。通用大模型进入银行或金融科技公司的生产环境,面临无标注数据、无操作手册、无充裕 GPU、甚至"标准答案"缺失的窘境。
|
||||
|
||||
## 核心内容
|
||||
|
||||
### 冰山难题
|
||||
- 零数据困境:输入 X 和标签 Y 都不存在,监督微调无法启动
|
||||
- 评估盲区:生成式输出缺乏标准答案,难以客观量化评估
|
||||
- 算力与合规壁垒:必须本地化部署,受限硬件预算
|
||||
|
||||
### 数据与知识工程
|
||||
- 基于 REER 算法的逆向知识提炼:从 QA 对中反向提取业务手册的四步流程
|
||||
- 多维合成数据策略:客户/场景/录制人三维度构建训练数据多样性
|
||||
- LLM Wiki 方法:参考 Anthropic Captain 的 Markdown+Git 知识库方案
|
||||
|
||||
### 后训练与部署
|
||||
- APO 自动提示工程:作为高质量 Base Prompt 的基线生成器
|
||||
- 后训练成本博弈:SFT < 后置推理 RL < 前置推理 RL
|
||||
- MOE 模型 + LoRA 工具链冲突(VeRL 不支持)
|
||||
- AI Agent 辅助模型训练自动化
|
||||
- 推理加速:MOE 架构 + Int8 量化 + vLLM
|
||||
|
||||
### 情绪价值评估
|
||||
- "先看着对,后用着有效果":心理学方法构建评估器
|
||||
- 在商业签单阶段优先提供情绪价值,再追求硬指标
|
||||
Reference in New Issue
Block a user