研究生新生的基本知识点概要:
(1)  掌握基本的生物相关知识,主要包括氨基酸(Amino Acids)、蛋白质(Protein)、蛋白质结构(Protein Structure)、蛋白质功能(Protein Function)、基因(Gene)、基因表达数据(Gene Expression Data)等等。阅读资源包括以下几个方面:维基百科、百度文库、相关专业文献。
      推荐的书籍:
              (a) Book Chapter: From Sequence to Structure  Download
              (b) 生物信息学(影印本先锋版)/精要速览系列(Bioinformatics) 作者: (英国) (Westhead D. R.) 韦斯特海德
(2)  掌握基本的统计学知识以及常用的统计指标概念。
      以混淆矩阵(Confusion Matrix)为例,要理解从它衍生出的相关统计指标,例如True Positive (TP)、True Negaitve (TN)、False Positive(FP)、False Negative (FN)、Specificity、Sensitivity、Accuracy、MCC、ROC以及AUC等。给定一个混淆矩阵,要学会编程求解其他对应的统计指标。
(3)  掌握常用的生物信息学软件的安装、配置以及使用,例如:
PSI-BLAST、PSIPRED 等。要学会如何设计程序(例如Java)来调用这些软件。
(4)  学习模式识别和机器学习相关知识,对常用特征抽取及学习算法要有了解。一些常用的算法,例如KNN、Bayesian Classifier、SVM、RFs等要熟练掌握,并在若干实例问题上尝试这些算法的使用。
      推荐书籍:
              (a) 迪达等著(美). 模式分类. 机械工业出版社