129 lines
4.5 KiB
Markdown
129 lines
4.5 KiB
Markdown
---
|
||
title: "EML 算子 (Exp-Minus-Log)"
|
||
created: 2026-04-16
|
||
updated: 2026-04-16
|
||
type: concept
|
||
tags: [algorithm, concept, research]
|
||
sources: [raw/papers/odrzywolek-eml-single-operator-2026.md]
|
||
---
|
||
|
||
# EML 算子 (Exp-Minus-Log)
|
||
|
||
## 定义
|
||
|
||
EML (Exp-Minus-Log) 是一个二元算子,定义为:
|
||
|
||
$$\text{eml}(x,y) = \exp(x) - \ln(y)$$
|
||
|
||
该算子配合常数 $1$,构成了连续数学中的 **Sheffer 算子**——单一算子足以生成所有初等函数。
|
||
|
||
## 核心性质
|
||
|
||
### 完备性
|
||
- 与数字电路中的 NAND 门类似,EML 对初等函数具有完备性
|
||
- 两按钮计算器 $(1, \text{eml})$ 可替代 36 按钮科学计算器
|
||
- 可生成:所有算术运算、超越函数、数学常数 ($e,\pi,i$)
|
||
|
||
### 二叉树结构
|
||
每个 EML 表达式是同质节点的二叉树:
|
||
|
||
$$S \to 1 \mid \text{eml}(S,S)$$
|
||
|
||
这种结构与满二叉树和 Catalan 数同构,提供了规则的搜索空间。
|
||
|
||
### 复数中间值
|
||
- EML 计算需要在复数域内进行(至少内部如此)
|
||
- 类似于量子计算使用复振幅计算实概率
|
||
- 生成 $i$ 和 $\pi$ 需要计算 $\ln(-1)$
|
||
|
||
## 基本构造示例
|
||
|
||
| 目标 | EML 表达式 | 深度 |
|
||
|------|-----------|------|
|
||
| $e$ | $\text{eml}(1,1)$ | 1 |
|
||
| $e^x$ | $\text{eml}(x,1)$ | 1 |
|
||
| $\ln(x)$ | $\text{eml}(1,\text{eml}(\text{eml}(1,x),1))$ | 3 |
|
||
| $0$ | $\text{eml}(\text{eml}(1,1),\text{eml}(1,1))$ | 3 |
|
||
| $-1$ | 复杂组合 | 15-17 |
|
||
| $x+y$ | 复杂组合 | 19-27 |
|
||
| $x\times y$ | 复杂组合 | 17-41 |
|
||
|
||
## 变体算子
|
||
|
||
$$\begin{align}
|
||
\text{eml}(x,y) &= \exp(x) - \ln(y) & \text{需常量 } 1 \\
|
||
\text{edl}(x,y) &= \exp(x) / \ln(y) & \text{需常量 } e \\
|
||
-\text{eml}(y,x) &= \ln(x) - \exp(y) & \text{需常量 } -\infty
|
||
\end{align}$$
|
||
|
||
## 约化历程
|
||
|
||
从 36 个原始操作到 EML 的逐步约化:
|
||
|
||
1. **Base-36** — 标准科学计算器 (36 个原始操作)
|
||
2. **Calc 3** — 保留 $\exp,\ln,-x,1/x,+$ (6 个)
|
||
3. **Calc 2** — 保留 $\exp,\ln,-$ (4 个)
|
||
4. **Calc 1** — 使用 $x^y,\log_x y$ 和常量 $e$ 或 $\pi$ (4 个)
|
||
5. **Calc 0** — 使用 $\exp$ 和 $\log_x y$ (3 个)
|
||
6. **EML** — 单一二元算子 + 常量 1 (2 个)
|
||
|
||
## 应用场景
|
||
|
||
### 符号回归
|
||
EML 树可作为"主公式"架构:
|
||
- 构造固定深度的完整二叉树
|
||
- 每个输入是 $1$、变量 $x$ 或子树结果的线性组合
|
||
- 使用梯度优化(Adam)训练参数
|
||
- 训练后将权重"吸附"到 0/1 精确值
|
||
|
||
### 模拟电路
|
||
EML 可作为模拟计算的基本构建块,类似于运算放大器。
|
||
|
||
### 形式化验证
|
||
- 在 Mathematica 和 IEEE754 浮点中工作良好
|
||
- 在 Lean 4 中遇到挑战(因 $\ln(0)=0$ 的"垃圾值"定义)
|
||
- 需要处理扩展实数 ($\pm\infty$) 和复数分支切割
|
||
|
||
## 与符号回归的联系
|
||
|
||
EML 树表示使得 [[symbolic-regression]] 可通过梯度下降而非组合搜索实现:
|
||
|
||
1. **可训练电路**:EML 树成为可微分计算图
|
||
2. **标准优化器**:Adam 等梯度方法可优化树参数
|
||
3. **精确恢复**:在浅层深度(≤4)时,该方法可从数值数据恢复闭式初等函数
|
||
4. **损失地形**:统一结构相比异构表达式树可能提供更优的优化地形
|
||
|
||
## 与布尔逻辑的类比
|
||
|
||
| 方面 | 布尔逻辑 | 连续数学 |
|
||
|------|----------|----------|
|
||
| 通用原语 | NAND/NOR 门 | **EML 算子** |
|
||
| 元数 | 2 输入 | 2 输入 |
|
||
| 完备性 | 所有布尔函数 | 所有初等函数 |
|
||
| 结构 | 统一门网络 | 统一 EML 树 |
|
||
| 搜索空间 | 离散 | 连续(可微) |
|
||
|
||
## 研究意义
|
||
|
||
1. **神经-符号集成**:桥接神经网络(可微)与符号数学
|
||
2. **发现方法**:通过系统穷举搜索发现——暗示可能存在其他通用原语
|
||
3. **科学发现**:有潜力从数据中自动发现物理定律
|
||
4. **教育意义**:暗示微积分/分析教学的极简基础
|
||
|
||
## 开放问题
|
||
|
||
1. **无常量 Sheffer 算子** — 是否存在不需要区分常量的二元算子?
|
||
2. **一元 Sheffer 算子** — 是否存在同时作为激活函数和初等函数生成器的一元算子?
|
||
3. **更好性质的变体** — 是否存在非指数渐近、无定义域问题的类似算子?
|
||
4. **连续族** — EML 是否属于一个更大的连续算子族?
|
||
5. **最小深度** — 特定函数所需的最小 EML 树深度是多少?
|
||
6. **多维推广** — 该方法能否扩展到多元函数和偏微分方程?
|
||
7. **泛化影响** — EML 表示如何影响学习模型的泛化能力?
|
||
|
||
## 相关页面
|
||
|
||
- [[odrzywolek-eml-single-operator]] — EML 算子论文
|
||
- [[symbolic-regression]] — 应用领域
|
||
- [[computerized-adaptive-testing]] — CRLB 相关应用
|
||
- [[cramer-rao-lower-bound]] — Fisher 信息与参数估计
|