三角形数、五边形数和六边形数之间有一个重要关系:**每一个六边形数都是三角形数**。具体来说,六边形数 \(H_n = n(2n-1)\) 等于三角形数 \(T_{2n-1} = (2n-1)(2n)/2 = n(2n-1)\)。因此,问题转化为寻找**同时是五边形数和六边形数**的数(这样的数自动是三角形数)。 已知 \(T_{285} = P_{165} = H_{143} = 40755\),需要找到下一个这样的数。利用五边形数和六边形数的公式,设 \(P_k = H_j\),得到方程: \[ k(3k-1)/2 = j(2j-1) \] 两边乘以2并整理得: \[ 3k^2 - k = 4j^2 - 2j \] 通过配方,引入变量 \(u = 6k - 1\) 和 \(v = 4j - 1\),可将其转化为佩尔方程: \[ u^2 - 3v^2 = -2 \] 其中 \(u \equiv 5 \pmod{6}\),\(v \equiv 3 \pmod{4}\) 以保证 \(k\) 和 \(j\) 为整数。 该方程的解可通过迭代生成:若 \((u, v)\) 是一组解,则下一组解为 \((u', v') = (2u + 3v, u + 2v)\)。从已知解 \((u, v) = (989, 571)\)(对应 40755)开始,迭代并检查同余条件,得到下一组满足条件的解为 \((191861, 110771)\)。 由此计算出: - \(k = (u + 1)/6 = 31977\) - \(j = (v + 1)/4 = 27693\) 对应的数为: \[ x = P_k = \frac{k(3k-1)}{2} = \frac{31977 \times 95930}{2} = 1533776805 \] 验证可知该数同时也是六边形数和三角形数。 因此,下一个同时是三角形数、五边形数和六边形数的数是 **1533776805**。 --- # 关于 佩尔方程 (Pell's Equation) 下面从**历史来源、基本定义与形式、解的存在性与结构、典型求解方法、解之间的关系、广义佩尔方程及应用**等方面,对佩尔方程做一个系统、全面且尽量直观的介绍。 --- ## 一、历史来源与名称由来 ### 1.1 古印度的起源 佩尔方程实质上起源很早,最系统的早期研究来自古印度数学校派: - 7世纪的 **Brahmagupta(婆罗摩笈多)** 就研究了形如 \[ x^2 - Dy^2 = 1 \quad\text{或}\quad x^2 - Dy^2 = k \] 的方程。他提出了著名的 **“复合公式(composition)”**:如果 \[ x_1^2 - Dy_1^2 = n_1,\quad x_2^2 - Dy_2^2 = n_2 \] 则 \[ (x_1x_2 + D y_1 y_2)^2 - D(x_1y_2 + x_2y_1)^2 = n_1 n_2 \] 从而可以“复合”已有解构造新解,这是后世单位理论和解结构的雏形。 - 后来的印度数学家如 **Bhaskara II、Narayana Pandit** 等,发展了著名的 **Chakravala(循环法)** 算法,这是一种求解佩尔型方程的迭代算法,在计算效率和思想深度上都相当先进[1][2][3]。 ### 1.2 欧洲的再发现与系统化 - 17世纪,**Fermat(费马)** 在给欧洲同行的挑战中多次提出这类方程,要求找到对 \[ x^2 - Dy^2 = 1 \] 的普遍解法。 - 英国数学家 **Brouncker(布朗克)** 利用连分数方法最早给出了一般解法[1][2][4]。 - 18世纪,**Lagrange(拉格朗日)** 从连分数理论出发,给出了系统而完整的理论(包括“对任意非平方正整数 D,总存在无穷多解”的严格证明)。 ### 1.3 “佩尔方程”名称的误会 - 18世纪的 **Euler(欧拉)** 在论述这类方程时,误将相关成果归功于英国数学家 **John Pell**,而实际上 Pell 本人在该方程上的贡献并不突出。 - 这个误会流传开来,方程被称作“Pell's equation”,中文常译为 **佩尔方程**[1][3][6][9]。 总结:**佩尔方程起源于印度,被费马等人推动进入欧洲视野,拉格朗日完成理论化,最终却误以 Pell 命名。** --- ## 二、基本定义与形式 ### 2.1 标准佩尔方程 通常所说的“佩尔方程”是指: \[ x^2 - Dy^2 = 1 \] 其中: - \(D\) 为正整数,且 **不是完全平方数**(若为完全平方则问题退化)。 - 要求 \(x,y\) 为整数(常常关注正整数解)。 若 \(D\) 是完全平方数,例如 \(D = k^2\),则 \[ x^2 - k^2 y^2 = (x - ky)(x + ky) = 1 \] 整数解只有平凡解 \((x,y) = (\pm1, 0)\),因此在数论中通常只考虑 **\(D\) 非平方**的情况。 ### 2.2 负佩尔方程 另一个常见的变体是 \[ x^2 - Dy^2 = -1 \] 通常称为 **负佩尔方程**。是否存在解取决于 \(D\) 的性质,尤其与 \(\sqrt{D}\) 的连分数展开 **周期长度的奇偶性** 有关(下文会提到)。 ### 2.3 广义佩尔方程 再推广一步,可以考虑 \[ x^2 - Dy^2 = N \] 其中 \(N\) 为任意整数。这类方程常称为 **广义佩尔方程(generalized Pell equation)**[2][3][5][7]。 - 当 \(N = 1\) 就是标准佩尔方程。 - 当 \(N = -1\) 即负佩尔方程。 - 一般 \(N\) 的解的存在性和结构与标准方程的解有密切联系。 --- ## 三、解的存在性与基本结构 ### 3.1 拉格朗日定理:总有无穷多解 **定理(Lagrange):** 对任意非平方正整数 \(D\),方程 \[ x^2 - Dy^2 = 1 \] 在整数中有 **无限多组非平凡解** \((x,y)\)[1][2][3][6]。 这意味着: - 不仅总有解,而且解集非常丰富。 - 所有正整数解中存在**一组最小的正解** \((x_1,y_1)\),称为 **基本解 / 最小解 / fundamental solution**。 - 其他所有正整数解都可以从这组基本解“生成”。 ### 3.2 解的指数结构 一个非常重要的结构结论是: > 若 \((x_1, y_1)\) 是 \(x^2 - Dy^2 = 1\) 的基本解,则所有正整数解 \((x_n,y_n)\) 可以用 > \[ > x_n + y_n\sqrt{D} = (x_1 + y_1\sqrt{D})^n,\quad n = 1,2,3,\dots > \] > 来表示。 其中: - \(n = 1\) 时就是基本解; - 对每个 \(n\),\((x_n,y_n)\) 都是整数解; - 不同的 \(n\) 给出互不相同的解。 这实际上利用了二次域 \(\mathbb{Q}(\sqrt{D})\) 中的“单位”(范数为 1 的代数整数),即: \[ N(x + y\sqrt{D}) = (x + y\sqrt{D})(x - y\sqrt{D}) = x^2 - Dy^2 \] 佩尔方程的解正是 **范数为 1 的单位元**。 --- ## 四、典型求解方法:为什么连分数如此核心? 佩尔方程最实用、也最经典的求解方法是 **连分数法(continued fractions)**。其核心在于一个深刻的事实: > **\(\sqrt{D}\) 的连分数展开是周期性的; > 佩尔方程的解可以通过其连分数的收敛分数(convergents)获得。** ### 4.1 \(\sqrt{D}\) 的连分数展开 对于 \(D\) 非平方,\(\sqrt{D}\) 是无理数,它的连分数展开形式是 \[ \sqrt{D} = [a_0; a_1, a_2, \dots] = a_0 + \cfrac{1}{a_1 + \cfrac{1}{a_2 + \cdots}} \] 且有一个重要结论[1][3][6][10]: - 该连分数是 **纯周期的(自某处起循环)**: \[ \sqrt{D} = [a_0; \overline{a_1, a_2, \dots, a_n}] \] 上面的横线表示 \((a_1,\dots,a_n)\) 反复循环。 - 这个周期长度 \(n\)(有时也写作 \(\ell\))决定了佩尔方程解的结构,尤其和**负佩尔方程是否有解**有强关联。 ### 4.2 收敛分数与基本解 连分数的第 \(k\) 个 **收敛分数** \(p_k/q_k\) 由递推公式给出: \[ \begin{cases} p_{-2}=0,\; p_{-1}=1 \\ q_{-2}=1,\; q_{-1}=0 \\ p_k = a_k p_{k-1} + p_{k-2} \\ q_k = a_k q_{k-1} + q_{k-2} \end{cases} \] 关键事实: - 对某些 \(k\),\((x,y)=(p_k,q_k)\) 会满足 \(x^2 - Dy^2 = \pm 1\)。 - 周期长度的奇偶决定我们应看第几个收敛分数来得到**基本解**。 更具体地(略去严密证明,只给结论): - 若周期长度 \(n\) 为 **偶数**,则 基本解来自 “周期结束位置”的收敛分数。 - 若周期长度 \(n\) 为 **奇数**,则 通常需要看“两个周期”的收敛分数,即更靠后的一项。 典型例子: \(\sqrt{61}\) 的连分数为 \[ \sqrt{61} = [7; \overline{1,4,3,1,2,2,1,3,4,1,14}] \] 周期长度为 11(奇数),对应的基本解为: \[ x_1 = 1766319049,\quad y_1 = 226153980 \] 这是一个非常大的解,说明基本解 **可能极其巨大**(这在计算理论上非常重要)。 ### 4.3 Chakravala(循环法) 另一个经典方法是印度的 **Chakravala algorithm**(循环法)[2][3][5]: - 通过从“近似解”开始,不断调整,使 \[ x^2 - Dy^2 = k \] 中的绝对值 \(|k|\) 逐步缩小,最终达到 \(k = \pm1\)。 - 每一步更新利用类似 Brahmagupta 复合公式的构造。 - 在很多 \(D\) 的情形下,它比直接算连分数更高效。 现代教材多以连分数为主,但在历史与算法思想上,Chakravala 非常值得单独研究。 --- ## 五、解之间的关系与递推公式 ### 5.1 “乘法封闭”与单位群结构 设 \((x_1,y_1)\) 和 \((x_2,y_2)\) 均是 \[ x^2 - Dy^2 = 1 \] 的解,则考虑 \[ (x_1 + y_1\sqrt{D})(x_2 + y_2\sqrt{D}) = (x_3 + y_3\sqrt{D}) \] 展开可得: \[ x_3 = x_1x_2 + Dy_1y_2,\quad y_3 = x_1y_2 + x_2y_1 \] 可以验证: \[ x_3^2 - Dy_3^2 = (x_1^2 - Dy_1^2)(x_2^2 - Dy_2^2) = 1\cdot1 = 1 \] 即:**两个解的“乘法”仍是解**[2][6][8]。这说明佩尔方程解在运算 \[ (x,y) \cdot (x',y') = (x x' + D y y',\, x y' + x' y) \] 下形成一个 **阿贝尔群**,这本质上就是 \(\mathbb{Z}[\sqrt{D}]\) 中单位元群。 ### 5.2 从基本解生成所有解:指数关系 如前所述,若 \((x_1,y_1)\) 是基本解,则 \[ x_n + y_n\sqrt{D} = (x_1 + y_1\sqrt{D})^n \] 因此得到显式递推公式(可由二项式展开得到): - 一阶递推: \[ \begin{cases} x_{n+1} = x_1 x_n + D y_1 y_n \\ y_{n+1} = x_1 y_n + y_1 x_n \end{cases} \] - 二阶线性递推(只用 \(x_n\) 自身): \[ x_{n+1} = 2 x_1 x_n - x_{n-1},\quad y_{n+1} = 2 x_1 y_n - y_{n-1} \] 这是因为 \((x_1 + y_1\sqrt{D})\) 类似“特征根”,解序列是形如 \(\lambda^n\) 的线性递推。 这些递推在研究解的增长速度、解中出现“完全幂”等性质时非常有用[8][9]。 --- ## 六、广义佩尔方程 \(x^2 - Dy^2 = N\) ### 6.1 基本结构 广义佩尔方程: \[ x^2 - Dy^2 = N \] 其中 \(D\) 非平方,\(N\) 为任意整数[2][3][5][7]。 核心事实: - 若存在 **一个**整数解 \((x_0,y_0)\),且标准佩尔方程有基本解 \((x_1,y_1)\),则 所有解都可以写成 \[ x + y\sqrt{D} = (x_0 + y_0\sqrt{D})(x_1 + y_1\sqrt{D})^n,\quad n\in\mathbb{Z} \] - 即:解的集合是“单位群轨道上的一个整点”。 更直观地说: 1. **先解标准方程** \(x^2 - Dy^2 = 1\),求出单位元 \(u = x_1 + y_1\sqrt{D}\); 2. 若能找到一个满足 \(x^2 - Dy^2 = N\) 的特解 \(v = x_0 + y_0\sqrt{D}\), 3. 则所有解都是 \(v, uv, u^2 v, u^3 v, ...\) 这一无限序列中的整数点。 ### 6.2 解的存在性与条件 - 广义方程并不总有解,它的可解性与模 \(D\) 的二次剩余、类群结构等深层理论有关。 - 一旦有一个解,通常便会有无穷多解,这是因为可以不断乘以单位元 \(u\)。 在具体计算中,常先通过模数检查、有限搜索或用连分数辅助找到一个特解,再用标准佩尔方程的单位元生成全部解。 --- ## 七、佩尔方程通常解决或涉及哪些问题? 佩尔方程本身就是经典的丢番图问题,但它也广泛出现在以下情景中: ### 7.1 有理逼近与“最佳逼近” - 连分数理论告诉我们:连分数的收敛分数 \(p_k/q_k\) 给出对实数 \(\alpha\) 的 **最佳有理逼近**。 - 对 \(\alpha = \sqrt{D}\) 而言,满足 \[ \left| \sqrt{D} - \frac{x}{y} \right| \] 非常小的分数 \(\frac{x}{y}\) 常常来自佩尔方程解,因为若 \[ x^2 - Dy^2 = \pm 1 \] 则 \[ \left|\sqrt{D} - \frac{x}{y}\right| = \left|\frac{x^2 - Dy^2}{y(\sqrt{D} + x/y)}\right| \approx \frac{1}{2 \sqrt{D} y^2} \] - 因此,佩尔方程的解经常用于构造**对平方根的极优有理近似**。 ### 7.2 二次域与代数数论中的单位问题 在二次代数数域 \(\mathbb{Q}(\sqrt{D})\) 中: - 环 \(\mathbb{Z}[\sqrt{D}]\) 的单位元集合与佩尔方程的解一一对应: \[ N(x + y\sqrt{D}) = x^2 - Dy^2 = \pm 1 \] - 研究单位元结构(Dirichlet 单位定理的特例)即是在研究佩尔方程。 - 类数、理想分解、模形式等更高阶理论中,都频繁出现佩尔方程及其广义形式[3][7][9]。 ### 7.3 组合、几何与图论中的出现 - 一些关于 **整数点格、几何图形面积** 的问题会转化为方程 \(x^2 - Dy^2 = N\); - 在某些组合结构(例如 dessins d'enfants 的不变量研究)中也出现佩尔方程[7]。 ### 7.4 密码学与算法复杂度 - 佩尔方程提供了构造**巨大整数对**的自然途径,可用于某些密码构造或伪随机数生成; - 同时也出现在对某些加密算法的攻击分析中; - 在计算复杂性研究中,用来测试数论算法的效率。 --- ## 八、具体例子与直观体会 ### 8.1 小 D 的基本解示例 根据理论和连分数计算,可得到若干典型 D 的基本解(这里列出部分)[1][2][3][6]: | \(D\) | 基本解 \((x_1, y_1)\) | |------|----------------------| | 2 | (3, 2) | | 3 | (2, 1) | | 5 | (9, 4) | | 6 | (5, 2) | | 7 | (8, 3) | | 8 | (3, 1) | | 10 | (19, 6) | | 11 | (10, 3) | | 12 | (7, 2) | | 14 | (15, 4) | | 15 | (4, 1) | | 17 | (33, 8) | | 18 | (17, 4) | | 19 | (170, 39) | | 20 | (9, 2) | | 21 | (55, 12) | | 22 | (197, 42) | | 23 | (24, 5) | | 24 | (5, 1) | | 28 | (127, 24) | | 31 | (1520, 273) | | 43 | (3482, 531) | | 46 | (24335, 3588) | | 61 | (1766319049, 226153980) | 可以看到: - 有的 \(D\)(如 2,3,5)基本解较小; - 有的 \(D\)(如 61)基本解极大,这正是为什么佩尔方程在计算机上求解仍然具有挑战性。 ### 8.2 利用递推获得更高阶解的感受 以 \(D = 2\) 为例,方程 \[ x^2 - 2y^2 = 1 \] 基本解为 \((3,2)\)。则第二个解由 \[ x_2 + y_2\sqrt{2} = (3 + 2\sqrt{2})^2 = 17 + 12\sqrt{2} \] 即 \((x_2,y_2) = (17,12)\),验证: \[ 17^2 - 2\cdot 12^2 = 289 - 288 = 1 \] 第三个解: \[ (3 + 2\sqrt{2})^3 = 99 + 70\sqrt{2} \Rightarrow (x_3,y_3) = (99,70) \] 解的规模指数增长,这种**指数级膨胀**是佩尔方程序列的一大特征。 --- ## 九、总结:佩尔方程的内涵与价值 综合上述内容,可以从几个角度理解佩尔方程的“全貌”: 1. **来源** - 起源于古印度的丢番图方程研究,是 Brahmagupta–Bhaskara–Chakravala 传统的重要对象; - 17世纪由 Fermat 挑战推动,Brouncker 首给欧洲解法,18世纪 Lagrange 完成理论统一; - 名称源自 Euler 的误归功,John Pell 实际贡献有限。 2. **通常解决的问题** - 经典丢番图问题:给定非平方 \(D\),求所有整数解 \((x,y)\) 使 \(x^2 - Dy^2 = 1\); - 给出 \(\sqrt{D}\) 的最佳有理逼近; - 在二次代数数域中,描述环 \(\mathbb{Z}[\sqrt{D}]\) 的单位元结构; - 为广义方程 \(x^2 - Dy^2 = N\) 提供单位群背景,从而刻画其全部解; - 在密码学、几何、图论等领域,作为子问题或工具频繁出现。 3. **解的关系与结构** - 存在唯一(在正象限)的**最小正解** \((x_1,y_1)\),称为基本解; - 所有解满足 \[ x_n + y_n\sqrt{D} = (x_1 + y_1\sqrt{D})^n \] 呈现指数结构; - 两个解的“乘积”仍是解,形成单位群,递推关系 \[ x_{n+1} = x_1x_n + Dy_1y_n,\quad y_{n+1} = x_1y_n + y_1x_n \] 或二阶线性递推形式; - 对广义方程 \(x^2 - Dy^2 = N\),一旦有一个特解 \((x_0,y_0)\),所有解由 \[ (x_0 + y_0\sqrt{D})(x_1 + y_1\sqrt{D})^n \] 给出。 4. **解法的核心思路** - 通过 \(\sqrt{D}\) 的 **连分数展开** 及其收敛分数,找到基本解; - 或用 Chakravala 循环法等算法迭代逼近; - 本质上都是在寻找“范数为 1 的单位”。 佩尔方程表面上只是一个简单的二次方程,但它串联了: - 古典丢番图方程; - 连分数与最优有理逼近; - 代数数论中的单位与范数; - 算法数论和复杂性问题。 从历史、理论到算法与应用,都是一个非常典型又极具深度的数学对象。 --- ### References [1] Pell's equation. [2] Pell equation - AoPS Wiki. [3] Pell Equation -- Wolfram MathWorld. [4] Pell's equation - MacTutor History of Mathematics. [5] PELL'S EQUATION, I & II, by K. Conrad (PDFs). / [6] Continued Fractions and Pell's Equation (various lecture notes). [7] Generalized Pell equations and applications (Stanford / UConn handouts). [8] Recurrence relations for Pell's equation solutions (MathStackExchange, etc.). [9] On the Brahmagupta–Fermat–Pell Equation. [10] Continued fractions and Pell's equation (expository PDFs).