研究生新生入学基本要求: (1) 掌握基本的统计学知识以及常用的统计指标概念。 以混淆矩阵(Confusion Matrix)为例,要理解从它衍生出的相关统计指标,例如True Positive (TP)、True Negaitve (TN)、False Positive(FP)、False Negative (FN)、Specificity、Sensitivity、Accuracy、MCC、ROC以及AUC等。给定一个混淆矩阵,要学会编程求解其他对应的统计指标。 (2) 学习模式识别和机器学习相关知识,对常用特征抽取及学习算法要有了解。一些常用的算法,例如KNN、Bayesian Classifier、SVM、RFs等要熟练掌握,并在若干实例问题上尝试这些算法的使用。 推荐书籍: 周志华. 机器学习, 清华大学出版社 迪达等著(美). 模式分类, 机械工业出版社 (3) 掌握基本的生物相关知识,主要包括氨基酸(Amino Acids)、蛋白质(Protein)、蛋白质结构(Protein Structure)、蛋白质功能(Protein Function)、基因(Gene)、基因表达数据(Gene Expression Data)等等。 推荐书籍: Book Chapter: From Sequence to Structure Download 生物信息学(影印本先锋版)/精要速览系列(Bioinformatics) 作者: (英国) (Westhead D. R.) 韦斯特海德 (4) 掌握常用的生物信息学软件的安装、配置以及使用,例如:PSI-BLAST、PSIPRED 等。要学会如何设计程序(例如Java)来调用这些软件。 |