用一道数学题比较当下最流行的模型

概述

今天用一道高中数学导数大题同时问3个AI,结果令人大吃一惊。

首先来看题目:

已知函数 \(f(x) = e^{2x}-5e^x + \lambda x\).

(1)若 \(\lambda = 2\),求 \(f(x)\) 的极值;

(2)若 \(f(x)\) 在区间 \((-\infty, 0)\) 上存在零点,求实数 \(\lambda\) 的取值范围.

使用的 prompt 如下:

1
2
3
已知函数 f(x) = e^{2x}-5e^x + \lambda x.
(1)若 \lambda = 2,求 f(x) 的极值;
(2)若 f(x) 在区间(-\infty, 0)上存在零点,求实数 \lambda 的取值范围.

Deepseek 的回答

我首先问了当下最火的中国大模型 deepseek-r1 ,由于它的思考过程过于冗长,我们在这里只关注它的最终结果,但思考过程也会在这里附上。

已知函数 \(f(x)=e^{2x}-5e^{x}+\lambda x\)

(1)当 \(\lambda = 2\) 时,求 \(f(x)\) 的极值:

首先求导函数 \(f'(x)\)

\[ f'(x) = 2e^{2x}-5e^{x}+2 \]

\(f'(x)=0\),解得:

\[ 2e^{2x}-5e^{x}+2=0 \]

\(t=e^x\),方程变为:

\[ 2t^2-5t+2=0 \]

解得 \(t=2\)\(t=\frac{1}{2}\),即 \(x=ln2\)\(x=-ln2\)

计算二阶导数 \(f''(x)\)

\[ f''(x)=4e^{2x}-5e^{x} \]

\(x=ln2\) 处:

\[ f''(ln2)=4e^{2ln2}-5e^{ln2}=4 \cdot 4 - 5 \cdot 2 = 6 > 0 \]

因此 \(x=ln2\) 处有极小值:

\[ f(ln2)=e^{2ln2}-5e^{ln2}+2ln2=4-10+2ln2=-6+2ln2 \]

\(x=-ln2\) 处:

\[ f''(-ln2)=4e^{-2ln2}-5e^{-ln2}=4 \cdot \frac{1}{4}-5 \cdot \frac{1}{2}=-1.5<0 \]

因此 \(x=-ln2\) 处有极大值:

\[ f(-ln2)=e^{-2ln2}-5e^{-ln2}-2ln2=\frac{1}{4}-\frac{5}{2}-2ln2=-\frac{9}{4}-2ln2 \]

(2)若 \(f(x)\) 在区间 \((-\infty,0)\) 上存在零点,求实数 \(\lambda\) 的取值范围:

分析函数 \(f(x) = e^{2x}-5e^{x}+\lambda x\) 在区间 \((-\infty,0)\) 上的行为:

\(x→-\infty\) 时,\(e^{2x}\)\(e^x\) 均趋近于 \(0\),函数行为由 \(\lambda x\) 主导:

  • \(\lambda > 0\),则 \(f(x)→-\infty\)
  • \(\lambda < 0\),则 \(f(x)→+\infty\)

\(x→0^-\) 时,\(f(x)→-4\)

\(\lambda < 0\) 时,\(f(x)\)\(x→-\infty\) 时趋向于 \(+\infty\),在 \(x→0^-\) 时趋向于 \(-4\),根据中间值定理,必定存在零点。

\(\lambda \ge 0\) 时,分析 \(f(x)\) 的极值点和函数值,发现不存在零点。

因此,实数 \(\lambda\) 的取值范围为 \(\lambda < 0\)

可以看出,deepseek-r1 能完美答对,就是思考过程太长。

Gemini 的回答

接下来是 Google 在上个月推出的推理模型 gemini-2.0-flash-thinking-exp-01-21

解:

(1)当 \(\lambda = 2\) 时,\(f(x) = e^{2x}-5e^x + 2x\).

求导得 \(f'(x) = 2e^{2x} - 5e^x + 2\).

\(f'(x) = 0\),则 \(2e^{2x} - 5e^x + 2 = 0\),设 \(t = e^x\),则 \(2t^2 - 5t + 2 = 0\),解得 \((2t - 1)(t - 2) = 0\),所以 \(t = \frac{1}{2}\)\(t = 2\).

\(e^x = \frac{1}{2}\)\(e^x = 2\),解得 \(x = ln(\frac{1}{2}) = -ln(2)\)\(x = ln(2)\).

求二阶导数 \(f''(x) = 4e^{2x} - 5e^x\).

\(x = -ln(2)\) 时,\(f''(-ln(2))\) = \(4e^{-2ln(2)} - 5e^{-ln(2)} = 4e^{ln(1/4)} - 5e^{ln(1/2)} = 4 \cdot \frac{1}{4} - 5 \cdot \frac{1}{2} = 1 - \frac{5}{2} = -\frac{3}{2} < 0\).

所以 \(f(x)\)\(x = -ln(2)\) 处取得极大值,极大值为 \(f(-ln(2)) = e^{-2ln(2)} - 5e^{-ln(2)} + 2(-ln(2)) = \frac{1}{4} - 5 \cdot \frac{1}{2} - 2ln(2) = -\frac{9}{4} - 2ln(2)\).

\(x = ln(2)\) 时,\(f''(ln(2)) = 4e^{2ln(2)} - 5e^{ln(2)} = 4e^{ln(4)} - 5e^{ln(2)} = 4 \cdot 4 - 5 \cdot 2 = 16 - 10 = 6 > 0\).

所以 \(f(x)\)\(x = ln(2)\) 处取得极小值,极小值为 \(f(ln(2)) = e^{2ln(2)} - 5e^{ln(2)} + 2ln(2) = 4 - 5 \cdot 2 + 2ln(2) = -6 + 2ln(2)\).

(2)要使 \(f(x)\) 在区间 \((-\infty, 0)\) 上存在零点,即存在 \(x \in (-\infty, 0)\) 使得 \(f(x) = 0\),即 \(e^{2x}-5e^x + \lambda x = 0\).

\(x \neq 0\) 时,\(\lambda = \frac{5e^x - e^{2x}}{x}\). 设 \(g(x) = \frac{5e^x - e^{2x}}{x}\). 我们需要求 \(g(x)\)\((-\infty, 0)\) 上的值域.

求导得 \(g'(x) = \frac{(5e^x - 2e^{2x})x - (5e^x - e^{2x})}{x^2} = \frac{5xe^x - 2xe^{2x} - 5e^x + e^{2x}}{x^2} = \frac{e^x(5x - 2xe^x - 5 + e^x)}{x^2}\).

\(h(x) = 5x - 2xe^x - 5 + e^x\). 则 \(h'(x) = 5 - 2e^x - 2xe^x + e^x = 5 - e^x - 2xe^x\).

\(h''(x) = -e^x - 2e^x - 2xe^x = -3e^x - 2xe^x = -e^x(3 + 2x)\).

\(x < -3/2\) 时,\(h''(x) > 0\)\(h'(x)\) 递增;当 \(x > -3/2\) 时,\(h''(x) < 0\)\(h'(x)\) 递减.

\(h'(x)\)\(x = -3/2\) 处取得极大值 \(h'(-3/2) = 5 - e^{-3/2} - 2(-\frac{3}{2})e^{-3/2} = 5 - e^{-3/2} + 3e^{-3/2} = 5 + 2e^{-3/2} > 0\).

\(\lim_{x \to -\infty} h'(x) = 5 > 0,h'(0) = 5 - 1 - 0 = 4 > 0\). 所以 \(h'(x) > 0\)\((-\infty, 0)\) 上恒成立,\(h(x)\)\((-\infty, 0)\) 上递增.

\(\lim_{x \to -\infty} h(x) = \lim_{x \to -\infty} (5x - 2xe^x - 5 + e^x) = -\infty - 0 - 5 + 0 = -\infty\).

\(h(0) = -5 + 1 = -4 < 0\). 所以 \(h(x) < 0\)\((-\infty, 0)\) 上恒成立.

因此 \(g'(x) < 0\)\((-\infty, 0)\) 上恒成立,\(g(x)\)\((-\infty, 0)\) 上递减.

\(\lim_{x \to -\infty} g(x) = \lim_{x \to -\infty} \frac{5e^x - e^{2x}}{x} = 0\).

\(\lim_{x \to 0^-} g(x) = \lim_{x \to 0^-} \frac{5e^x - e^{2x}}{x} = \frac{4}{0^-} = -\infty\).

所以 \(g(x)\)\((-\infty, 0)\) 上的值域为 \((-\infty, 0)\).

因此,实数 \(\lambda\) 的取值范围为 \((-\infty, 0)\).

最终答案:

(1)当 \(\lambda = 2\) 时,\(f(x)\)\(x = -ln(2)\) 处取得极大值 \(-\frac{9}{4} - 2ln(2)\),在 \(x = ln(2)\) 处取得极小值 \(-6 + 2ln(2)\).

(2)实数 \(\lambda\) 的取值范围为 \((-\infty, 0)\).

比较意外的是这个 Goodle 的模型也可以答对。顺便说一下,这个模型在 deepseek-r1 推出的一天后就发布了,其实是无意追赶 Deepseek(因为那时候 deepseek 还不火),但有这样的表现着实惊艳。

ChatGPT 的回答

接下来是 OpenAI 最新的推理模型 o3-mini

(1)若 λ = 2,求 f(x) 的极值。 已知函数:

\[ f(x) = e^{2x} - 5e^x + \lambda x \]

\(\lambda = 2\) 时,函数变为:

\[ f(x) = e^{2x} - 5e^x + 2x \]

首先,求 f(x) 的一阶导数:

\[ f'(x) = \frac{d}{dx}(e^{2x}) - \frac{d}{dx}(5e^x) + \frac{d}{dx}(2x) \]

\[ f'(x) = 2e^{2x} - 5e^x + 2 \]

为了找极值点,解方程 \(f'(x) = 0\)

\[ 2e^{2x} - 5e^x + 2 = 0 \]

\(y = e^x\),则 \(e^{2x} = y^2\),方程变为:

\[ 2y^2 - 5y + 2 = 0 \]

解这个二次方程:

\[ y = \frac{-(-5) \pm \sqrt{(-5)^2 - 4 \cdot 2 \cdot 2}}{2 \cdot 2} = \frac{5 \pm \sqrt{25 - 16}}{4} = \frac{5 \pm \sqrt{9}}{4} \]

\[ y = \frac{5 \pm 3}{4} \]

所以,\(y = 2\)\(y = \frac{1}{2}\)

因此,\(e^x = 2\)\(e^x = \frac{1}{2}\),即:

\[ x = \ln 2 \quad \text{或} \quad x = -\ln 2 \]

这两个点分别为极值点。

接下来,判断这两个点的极值类型。我们求 f(x) 的二阶导数:

\[ f''(x) = \frac{d}{dx}(2e^{2x} - 5e^x + 2) = 4e^{2x} - 5e^x \]

\(x = \ln 2\) 处:

\[ f''(\ln 2) = 4e^{2\ln 2} - 5e^{\ln 2} = 4 \cdot 4 - 5 \cdot 2 = 16 - 10 = 6 > 0 \]

所以,\(x = \ln 2\) 是一个极小值点。

\(x = -\ln 2\) 处:

\[ f''(-\ln 2) = 4e^{2(-\ln 2)} - 5e^{-\ln 2} = 4 \cdot \frac{1}{4} - 5 \cdot \frac{1}{2} = 1 - \frac{5}{2} = -\frac{3}{2} < 0 \]

所以,\(x = -\ln 2\) 是一个极大值点。

因此,\(x = \ln 2\) 为极小值点,\(x = -\ln 2\) 为极大值点。

(2)若 f(x) 在区间 \((-∞, 0)\) 上存在零点,求实数 \(\lambda\) 的取值范围。

首先,函数为:

\[ f(x) = e^{2x} - 5e^x + \lambda x \]

要使 f(x) 在区间 \((-∞, 0)\) 上有零点,首先分析函数的行为。我们首先考虑 f(x) 在 x = 0 处的值:

\[ f(0) = e^{2 \cdot 0} - 5e^0 + \lambda \cdot 0 = 1 - 5 = -4 \]

因此,\(f(0) = -4\)

对于 \(x \to -\infty\),因为 \(e^{2x} \to 0\)\(e^x \to 0\),所以当 \(x \to -\infty\) 时:

\[ f(x) \to 0 \]

我们分析 f(x) 的导数:

\[ f'(x) = 2e^{2x} - 5e^x + \lambda \]

对于 \(x \to -\infty\)\(e^x\)\(e^{2x}\) 都趋近于 0,因此:

\[ f'(x) \to \lambda \]

因此,如果 \(\lambda > 0\),则 \(f'(x) > 0\),即 f(x) 是递增的;如果 \(\lambda < 0\),则 \(f'(x) < 0\),即 f(x) 是递减的;如果 \(\lambda = 0\),则 \(f'(x) = 2e^{2x} - 5e^x\)\(x \to -\infty\) 时趋近于 0。

由于 \(f(0) = -4\),而 \(f(x) \to 0\)\(x \to -\infty\),如果 \(\lambda > 0\),那么 f(x) 是递增的,必定存在零点。而如果 \(\lambda \leq 0\),由于 \(f(x)\) 没有足够的上升趋势,它可能不会有零点。

因此,要使 f(x) 在区间 \((-∞, 0)\) 上存在零点,实数 \(\lambda\) 必须满足:

\[ \lambda > 0 \]

???

刚开始还以为用错模型了,再一看没错啊。

多试了几次,仍然是这种结果。

第一问就不太对,题目问极值却只求出了极值点。

很明显,这个模型很废物,竟然连 gemini 都不如,实在不知道 OpenAI 每天都在干啥。

会不会需要付费才能使用的 o3-mini-high 可以解答呢?我去浅试了一下:

\(f(x) = e^(2x) - 5e^x + λx\).

(1)当 \(λ = 2\) 时,\(f(x) = e^(2x) - 5e^x + 2x\).

求导:

\(f'(x) = 2e^(2x) - 5e^x + 2\).

\(f'(x) = 0\),令 \(u = e^x\)(注意 \(u > 0\)):

 有 $2u^2 - 5u + 2 = $.

解该二次方程:

\(Δ = 25 - 16 = 9\), 则 \(u = [5 ± 3] / 4\).

所以,\(u1 = 2\), \(u2 = 1/2\).

对应 \(x1 = ln2\), \(x2 = -ln2\).

计算二阶导数:

\(f''(x) = 4e^(2x) - 5e^x\).

\(x = ln2\):

\(f''(ln2) = 4(4) - 5(2) = 16 - 10 = 6 > 0\), 故 \(x = ln2\) 为局部最小点.

\(x = -ln2\):

\(f''(-ln2) = 4(1/4) - 5(1/2) = 1 - 2.5 = -1.5 < 0\), 故 \(x = -ln2\) 为局部最大点.

计算极值:

\(f(ln2) = e^(2ln2) - 5e^(ln2) + 2 ln2 = 4 - 10 + 2 ln2 = -6 + 2 ln2\).

\(f(-ln2) = e^(-2ln2) - 5e^(-ln2) + 2(-ln2) = 1/4 - 5/2 - 2 ln2 = -2.25 - 2 ln2\).

【答案1】:

 局部最大值:在 \(x = -ln2\), 值为 \(-2.25 - 2 ln2\).

 局部最小值:在 \(x = ln2\), 值为 \(-6 + 2 ln2\).

(2)讨论 \(f(x)\) 在区间 \((-∞, 0)\) 上存在零点的条件。

\(x = 0\):

\(f(0) = e^0 - 5e^0 + λ·0 = 1 - 5 = -4\).

\(x → -∞\) 时,由于 \(e^(2x) → 0\), \(e^x → 0\), 故 \(f(x) ≈ λx\).

\(λ < 0\),则当 \(x → -∞\) 时,\(λx → +∞\);此时 \(f(0) = -4\), 根据连续性,函数 \(f(x)\) 必经过零点,所以在 \((-∞, 0)\) 上至少存在一个零点.

\(λ ≥ 0\),则 \(x → -∞\)\(f(x) → -∞\)\(0\),且 \(f(0) = -4\),因此 \(f(x)\)\((-∞, 0)\) 内始终为负,不存在零点.

【答案2】:

\(f(x)\)\((-∞, 0)\) 上存在零点的充要条件为 \(λ < 0\).

这才是 OpenAI 应有的水平。要是这个付费模型都解不出来,那 OpenAI 不如早点关门吧。

总结

总的来说,这次测试结果真的令人大跌眼镜:

  • 一是 Google 的 gemini 竟然表现异常突出;
  • 二是 OpenAI 的免费模型竟然连 gemini 都不如。

最后来个模型的粗略比较。

推理能力:gemini-2.0-flash-thinking-exp-01-21 = deepseek-r1 = o3-mini-high >> o3-mini

用户体验:gemini-2.0-flash-thinking-exp-01-21 = o3-mini > deepseek-r1(因为思考时间过长) >> o3-mini-high(因为贵)

这样综合下来,gemini-2.0-flash-thinking-exp-01-21 是最后的赢家。


用一道数学题比较当下最流行的模型
https://www.liedou.cc/posts/4267/
作者
Liedou
发布于
2025年2月12日
许可协议