导数

版权声明:署名-非商业性使用-相同方式共享

@@ Tags: 数学;导数
@@ Date: 2025-02-25

导数(Derivative)是微积分学中的一个概念,函数在某一点的导数是指这个函数在这一点附近的变化率(即函数在这一点的切线斜率),导数的本质是通过极限的概念对函数进行局部的线性逼近。

函数 $f$ 对变量 $x$ 的导数表示 $f$ 随 $x$ 的变化率。换句话说,导数描述了函数 $f$ 在点 $x$ 处的瞬时变化率。形式上,导数记作 $\frac{df}{dx}$,表示当 $x$ 变化一个微小量时, $f$ 变化的量。

定义

当函数 $f(x)$ 的自变量 $x$ 在点 $x_0$ 上产生一个增量 $h$ 时,函数输出值的增量与自变量增量 $h$ 的比值在 $h$ 趋于 $0$ 时的极限如果存在,即为 $f(x)$ 在 $x_0$ 处的导数,记作 $f'(x_0)$。

设函数 $f(x)$ 在点 $x_0$ 的某邻域有定义,若极限

$$
f'(x_0) = \lim_{h \to 0} \frac{f(x_0 + h) - f(x_0)}{h}
$$

存在,则称 $f(x)$ 在 $x_0$ 处可导,$f'(x_0)$ 即为 $f(x)$ 在 $x_0$ 点的导数。

导数 $f'(x_0)$ 表示函数 $f(x)$ 在 $x_0$ 处的切线斜率,这也是导数的几何意义。

笔记

  • 在 $x_0$ 处 可理解为 当 $x=x_0$ 的时候。
  • 邻域 是集合中的概念,表示点 $x_0$ 附近的一段区域(不包含点 $x_0$)。

Graph_of_sliding_derivative_line

$x$ 变化时函数 $1+𝑥sin(𝑥^2)$(蓝色曲线)的切线变化。函数的导数值就是切线的斜率,绿色代表其值为正,红色代表其值为负,黑色代表值为零。

记法 & 公式

导数的记法有多种形式,具体取决于上下文和使用习惯。

1. 莱布尼茨记法(Leibniz Notation)

这是最常见的导数记法,用 $\frac{dy}{dx}$ 表示 $y$ 对 $x$ 的导数。

  • 公式
    $$
    \frac{dy}{dx} = \lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x}
    $$

    $$
    \frac{d}{dx} f(x)
    $$

    其中:

    • $\Delta y = f(x + \Delta x) - f(x)$ 是函数值的变化量。
    • $\Delta x$ 是自变量的变化量。
  • 示例
    如果 $y = x^2$,则:
    $$
    \frac{dy}{dx} = 2x
    $$

2. 拉格朗日记法(Lagrange Notation)

用 $f'(x)$ 表示函数 $f(x)$ 的导数。

  • 公式
    $$
    f'(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h}
    $$

  • 示例
    如果 $f(x) = \sin(x)$,则:
    $$
    f'(x) = \cos(x)
    $$

3. 牛顿记法(Newton Notation)

用 $\dot{y}$ 表示 $y$ 对时间 $t$ 的导数,常见于物理学中。

  • 公式
    $$
    \dot{y} = \frac{dy}{dt}
    $$

  • 示例
    如果 $y = t^3$,则:
    $$
    \dot{y} = 3t^2
    $$

导数的几何意义

导数的几何意义是函数图像在某一点处的切线斜率

  • 如果导数为正,函数在该点处是递增的。
  • 如果导数为负,函数在该点处是递减的。
  • 如果导数为零,函数在该点处可能是极值点(最大值或最小值)。

导数的物理意义

在物理学中,导数可以表示速度加速度等变化率。

例如,位移对时间的导数是速度,速度对时间的导数是加速度。

单侧导数

  • 左导数 $f'_-(x)$
  • 右导数 $f'_+(x)$

TODO 图

$f(x)$ 在 $x_0$ 处可导 $<=>$ 左右导数都存在相等

求导

求导是计算函数导数的过程,即找出函数在各点处的切线斜率。

求导方法

  1. 基本求导公式

    • $\frac{d}{dx} (c) = 0$ ($c$ 为常数)
    • $\frac{d}{dx} (x) = 1$
    • $\frac{d}{dx} (x^n) = n x^{n-1}$ ($n$ 为实数)
    • $\frac{d}{dx} (e^x) = e^x$
    • $\frac{d}{dx} (e^{-x}) = -e^{-x}$
    • $\frac{d}{dx} (a^x) = a^x \times ln(a)$
    • $\frac{d}{dx} (\ln x) = \frac{1}{x}$
  2. 求导法则

    • 加法法则
      $$\frac{d}{dx} [f(x) + g(x)] = f'(x) + g'(x)$$
    • 乘法法则
      $$\frac{d}{dx} [f(x) \cdot g(x)] = f'(x) g(x) + f(x) g'(x)$$
    • 链式法则
      $$\frac{d}{dx} [f(g(x))] = f'(g(x)) \cdot g'(x)$$

例1: 求函数 $f(x)=x^2$ 的导数

使用幂函数的导数公式

幂函数的导数公式为:

$$
\frac{d}{dx}(x^n) = n \cdot x^{n-1}
$$

对于 $f(x) = x^2$,幂指数 $n = 2$,因此:

$$
\frac{d}{dx}(x^2) = 2 \cdot x^{2-1} = 2x
$$

使用公式代入推导

  1. 写出导数的定义:
    $$
    \frac{dy}{dx} = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h}
    $$
  2. 代入 $f(x) = x^2$:
    $$
    \frac{dy}{dx} = \lim_{h \to 0} \frac{(x + h)^2 - x^2}{h}
    $$
  3. 代入利用完全平方和公式展开:
    $$
    \frac{dy}{dx} = \lim_{h \to 0} \frac{x^2 + 2xh + h^2 - x^2}{h}
    $$
  4. 简化分子:
    $$
    \frac{dy}{dx} = \lim_{h \to 0} \frac{2xh + h^2}{h}
    $$
  5. 约分 $h$:
    $$
    \frac{dy}{dx} = \lim_{h \to 0} (2x + h)
    $$
  6. 取极限 $h \to 0$:
    $$
    \frac{dy}{dx} = 2x + 0 = 2x
    $$

例2: 求函数 $f(x)=\frac{1}{x}$ 的导数

  1. 代入函数表达式
    $$ f'(x) = \lim_{h \to 0} \frac{\frac{1}{x + h} - \frac{1}{x}}{h} $$

  2. 将分子部分通分:
    $$ \frac{1}{x + h} - \frac{1}{x} = \frac{x - (x + h)}{x(x + h)} = \frac{-h}{x(x + h)} $$

  3. 将通分结果代入导数表达式:
    $$ f'(x) = \lim_{h \to 0} \frac{\frac{-h}{x(x + h)}}{h} = \lim_{h \to 0} \frac{-h}{x(x + h)h} $$

  4. 约简 $h$:
    $$ f'(x) = \lim_{h \to 0} \frac{-1}{x(x + h)} $$

  5. 求极限,当 $h \to 0$时,$x + h \to x$,因此:
    $$ f'(x) = \frac{-1}{x^2} = -x^{-2} $$

例3: 求函数 $f(x)=e^{-1}$ 的导数

  1. 函数 $f(x) = e^{-x}$ 是一个复合函数,其中:
  • 外层函数是指数函数:$g=e^{h}$。
  • 内层函数是线性函数:$h=-x$。
  1. 使用链式法则代入:

$$
\begin{aligned}
\frac{d}{dx} \left( g(h(x)) \right) &= g'(h(x)) \cdot h'(x) \\
\frac{d}{dx} e^{-x} &= g'(h(x)) \cdot h'(x)\\
\frac{d}{dx} e^{-x} &= e^{-x} \cdot -1 = -e^{-x} \\
\end{aligned}
$$

  • 外层指数函数的导数:$g'(h) = \frac{d}{dh} e^h = e^h$
  • 内层线性函数的导数:$h'(x) = \frac{d}{dx} (-x) = -1$

例4: 求Sigmoid函数 $f(x) = \frac{1}{1 + e^{-x}}$ 的导数

  1. 首先,将 Sigmoid 函数写成指数形式:

$$
f(x) = (1 + e^{-x})^{-1}
$$

  1. 使用链式法则:

$$
f'(x) = \frac{d}{dx} \left( (1 + e^{-x})^{-1} \right)
$$

链式法则的公式为:
$$
\frac{d}{dx} \left( g(h(x)) \right) = g'(h(x)) \cdot h'(x)
$$

在这里:

  • $g(u) = u^{-1}$,其导数为 $g'(u) = -u^{-2}$;
  • $h(x) = 1 + e^{-x}$,其导数为 $h'(x) = -e^{-x}$。

因此:
$$
f'(x) = g'(h(x)) \cdot h'(x) = -\left(1 + e^{-x}\right)^{-2} \cdot (-e^{-x})
$$

  1. 将导数表达式化简:

$$
f'(x) = \frac{e^{-x}}{(1 + e^{-x})^2}
$$

  1. 用 Sigmoid 函数表示, 注意到 $f(x) = \frac{1}{1 + e^{-x}}$,因此可以将导数表示为:

$$
f'(x) = f(x) \cdot (1 - f(x))
$$

推导过程:
$$
f'(x) = \frac{e^{-x}}{(1 + e^{-x})^2} = \frac{1}{1 + e^{-x}} \cdot \frac{e^{-x}}{1 + e^{-x}} = f(x) \cdot \left(1 - \frac{1}{1 + e^{-x}}\right) = f(x) \cdot (1 - f(x))
$$

离散数据的导数计算

假设摩托车在行驶过程中记录下的时间与速度的关系:

  • 速度:y: [10, 12, 15, 80, 85, 90]
  • 时间:x: [1 2 3 4 5 6 ]
  • 函数关系:$y = f(x)$

根据连续导数定义公式:

$$
f'(x_0) = \lim_{h \to 0} \frac{f(x_0 + h) - f(x_0)}{h}
$$

对于离散数据来说,不能取 $h \rightarrow 0$,只能取有限小的 $\Delta x$(常取为数据点之间的固定间距 $h$, 在这里也就是 $h=1$)。

代入可得:

$$
f'(x_k) \approx \frac{f(x_k + h) - f(x_k)}{h}
$$

前向差分公式

上面这种公式,也叫前向差分公式

$$
f'(x_k) \approx \frac{f_{k+1} - f_k}{h}
$$

因为 $h=1$, 则简化为:

$$
f'(x_k) \approx f_{k+1} - f_k
$$

即:[2, 3, 65, 5, 5, N/A(没有下一个数据点)]

后向差分公式

$$
f'(x_k) \approx \frac{f_k - f_{k-1}}{h}
$$

或者

$$
f'(x_k) \approx f_k - f_{k-1}
$$

即:[N/A(没有上一个数据点), 2, 3, 65, 5, 5]

中心差分公式

还有更高精度的中间差分公式(取 $x$ 左右两边点的斜率),具体的推导式需要 泰勒级数 (Taylor Series)

$$
f'(x_k) \approx \frac{f_{k+1} - f_{k-1}}{2h}
$$

通常结合其他差分模式一起计算:

[2(左边界,通常用前向差分), 2.5, 34, 35, 5, 5(右边界,通常用后向差分)]

参考