2020-05-31数据库 / MySQL5 minutes read (About 821 words)

IDEA2019.2链接MySQL数据库以及问题解决

使用IDEA链接MySQL

首先介绍一下我所使用的版本：IDEA Ultimate 2019.02、MySQL用的是5.7的版本

2020-05-27数据库 / MySQL3 minutes read (About 400 words)

数据库/数据库链接报错解决/JDBC踩坑集合

JDBC向MySQL中添加字段时利用JUnit测试报错:java.lang.Exception: Method getConnection2() should be void，源码如下：

2020-05-27a minute read (About 148 words)

数据库/数据库链接报错解决/DataGrip-serverTimezone报错解决

在每次链接DataGrip时执行SQL语句都会报错，具体报错信息如下：

主要原因就是数据库时区设置错误，解决方法就是在你所在的数据库上右键，点击Properties，如图所示；

2020-05-27服务器 / Tomcata few seconds read (About 68 words)

解决IDEA中Tomcat9.X控制台输出乱码问题

IDEA版本为2019.3.2，Tomcat版本为9.0.31
使用文本编辑器打开Tomcat安装目录下的conf/logging.properties文件，删除java.util.logging.ConsoleHandler.encoding = UTF-8行，保存退出。

2020-05-14Algorithm / 算法4笔记20 minutes read (About 3032 words)

算法4笔记/排序算法

排序类算法模板

public static void sort(Comparable[] a) {
    //排序内容
}

private static boolean less(Comparable v, Comparable w) {
    //比较两数大小，若v小于w，则返回true
    return v.compareTo(w) < 0;
}

private static void exch(Comparable[] a, int i, int j) {
    //交换两元素位置
    Comparable t = a[i];
    a[i] = a[j];
    a[j] = t;
}

private static void show(Comparable[] a) {
    // 在单行中打印数组
    for (int i = 0; i < a.length; i++)
        StdOut.print(a[i] + " ");
    StdOut.println();
}

public static boolean isSorted(Comparable[] a) {
    //测试数组元素是否有序
    for (int i = 1; i < a.length; i++) {
        if (less(a[i], a[i - 1]))
            return false;
    }
    return true;
}

2020-05-09机器学习 / 图解机器学习笔记6 minutes read (About 899 words)

图解机器学习/第一章什么是机器学习

学习的种类

监督学习

是指学生从老师那里获取知识、信息，老师提供对错指示、告知最终答案的学习过程。这一类机器学习的典型任务包括：预测数值型数据的回归、预测分类标签的分类、预测顺序的排序等。

无监督学习

是指在没有老师的情况下，学生自学的过程。这一类机器学习的典型任务包括：聚类、异常检测等。

强化学习

是指在没有老师提示的情况下，自己对预测的结果进行评估的方法。这一类机器学习的典型任务包括：回归、分类、聚类和降维等。

2020-05-09机器学习 / 图解机器学习笔记6 minutes read (About 911 words)

图解机器学习/第五章稀疏学习

$l_1$约束的最小二乘学习法

$\mathop{min}_{\theta}J_{LS}(\theta) \quad 约束条件 \quad ||\theta||_1 \le R \\ ||\theta||_1 = \sum_{j=1}^b|\theta_j|$

$l_1$约束的最小二乘学习法，在有些著作中也成为Lasso回归。

2020-05-09机器学习 / 图解机器学习笔记8 minutes read (About 1196 words)

图解机器学习/第四章带有约束条件的最小二乘法

单纯的最小二乘法对于包含噪声的学习过程经常有过拟合的弱点

部分空间约束的最小二乘学习法

通过把参数空间限制在一定范围内，来防止过拟合现象。

$\mathop{min}_{\theta}J_{LS}(\theta) \quad 约束条件P\theta=\theta$

$P$是满足$P^2=P$和$P^{\intercal}=P$的$b\times b$矩阵，表示的是矩阵$P$的值域$\mathcal{R}(P)$的正交投影矩阵。通过附加$P\theta=P$约束条件，参数$\theta$就不会偏移到值域$\mathcal{R}(P)$范围外了。

2020-05-09机器学习 / 图解机器学习笔记5 minutes read (About 732 words)

图解机器学习/第十章概率分类法

对模式基于概率进行分类的手法称为概率分类法。基于概率的模式识别，是指对与模式$x$所对应的类别$y$的后验概率$p(y|x)$进行学习。其所属类别为后验概率达到最大值时所对应的类别。

$\hat{y} = \mathop{argmax}_{y=1,\dots,c}p(y|x)$

类别的后验概率$p(y=\hat{y}|x)$，可以理解为模式$x$属于类别$y$的可信度。另外，基于概率的模式识别算法还有一个优势，就是对于多种类别的分类问题通常会有较好的分类结果。

Logistic回归

Logistic模型的最大似然估计

Logistic回归，使用线性对数函数对分类后验概率$p(y|x)$进行模型化

$q(y|x;\theta)=\frac{exp(\sum_{j=1}^b \theta_j^{(y)} \phi_j(x)) }{\sum_{y'=1}^c exp(\sum_{j=1}^b \theta_j^{(y')} \phi_j(x))}$

Logistic回归模型的学习，通过对数似然为最大时的最大似然估计进行求解。

一般使用对数使得乘法变成加法的方法来防止丢位现象的发生。

2020-05-09机器学习 / 图解机器学习笔记5 minutes read (About 739 words)

图解机器学习/第十一章序列数据的分类

字符串的分类问题，比起将字符串拆分为独立的文字，并分别对各个文字进行识别，对字符串整体同时进行识别的话，因为能充分利用文字的前后关系，所以识别精度会更高。

序列数据的模型化

将顺序为$k$的模式定义为$x^{(k)}$，该模式所属的类别定义为$y^{(k)}$，然后将这样的$m$个模式的序列分别用$\overline{x}$和$\overline{y}$进行表示

$\overline{x} = (x^{(1)}, \dots, x^{(m)}), \overline{y} = (y^{(1)}, \dots,y^{(m)})$

如果对各个模式$x^{(k)}$进行独立的识别，那么$c$个类别的模式识别问题进行$m$次求解就可以完成对此模式序列的识别。然而，这样的识别方式并没有充分利用各个模式的前后关系。

在个模式的类别为$c$个的情况下，如果对连续的$m$个模式同时进行识别的话，就需要对$\overline{c} = c^m$个类别的模式识别问题进行求解。然而，在这种方式中，由于类别个数$\overline{c}$和参数$\overline{\theta}$的维度是以模式序列的长度$m$为基数呈指数级增长的，因此直接对其进行学习往往很困难。

假定只有前一个模式所属的类别$y^{(k-1)}$会对现在的模式$x^{(k)}$所属的类别$y^{(k)}$有影响，通过把连续的两个模式的识别加以组合，对模式序列全体进行识别。这样的方法，并不是简单地对连续的两种模式所对应的$c^2$个类别的识别问题进行单独求解，而是尽可能地对模式序列全体同时进行识别。这种方法称为条件随机场。

$q(\overline{y}|\overline{x};\zeta) = \frac{exp(\zeta^{\intercal} \varphi(\overline{x},\overline{y}))}{\sum_{\overline{y}'=1}^{\overline{c}} exp(\zeta^{\intercal} \varphi(\overline{x},\overline{y'}))}$

这里的$\varphi(\overline{x},\overline{y})$表示的是基函数的向量。