研究生新生入学基本要求:

(1) 掌握基本的统计学知识以及常用的统计指标概念。
      以混淆矩阵(Confusion Matrix)为例,要理解从它衍生出的相关统计指标,例如True Positive (TP)、True Negaitve (TN)、False Positive(FP)、False Negative (FN)、Specificity、Sensitivity、Accuracy、MCC、ROC以及AUC等。给定一个混淆矩阵,要学会编程求解其他对应的统计指标。

(2) 学习模式识别和机器学习相关知识,对常用特征抽取及学习算法要有了解。一些常用的算法,例如KNN、Bayesian Classifier、SVM、RFs等要熟练掌握,并在若干实例问题上尝试这些算法的使用。
       推荐书籍:

      周志华. 机器学习, 清华大学出版社              

      迪达等著(美). 模式分类, 机械工业出版社

(3) 掌握基本的生物相关知识,主要包括氨基酸(Amino Acids)、蛋白质(Protein)、蛋白质结构(Protein Structure)、蛋白质功能(Protein Function)、基因(Gene)、基因表达数据(Gene Expression Data)等等。
       推荐书籍:
       Book Chapter: From Sequence to Structure  
Download
       生物信息学(影印本先锋版)/精要速览系列(Bioinformatics) 作者: (英国) (Westhead D. R.) 韦斯特海德

(4)  掌握常用的生物信息学软件的安装、配置以及使用,例如:PSI-BLAST、PSIPRED 等。要学会如何设计程序(例如Java)来调用这些软件。


[Back] [Home]