前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇生物信息學范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞:推薦系統;生物信息學
推薦系統(RecommenderSystem)[1]是個性化信息服務的主要技術之一,它實現的是“信息找人,按需服務”;通過對用戶信息需要、興趣愛好和訪問歷史等的收集分析,建立用戶模型,并將用戶模型應用于網上信息的過濾和排序,從而為用戶提供感興趣的資源和信息。生物信息學(Bioinformatics)[2,3]是由生物學、應用數學和計算機科學相互交叉所形成的一門新型學科;其實質是利用信息科學的方法和技術來解決生物學問題。20世紀末生物信息學迅速發展,在信息的數量和質量上都極大地豐富了生物科學的數據資源,而數據資源的急劇膨脹需要尋求一種科學而有力的工具來組織它們,基于生物信息學的二次數據庫[4]能比較好地規范生物數據的分類與組織,但是用戶無法從大量的生物數據中尋求自己感興趣的部分(著名的生物信息學網站NCBI(美國國立生物技術信息中心),僅僅是小孢子蟲(Microsporidia)的DNA序列就達3399種),因此在生物二次數據庫上建立個性化推薦系統,能使用戶快速找到自己感興趣的生物信息。特別是在當前生物信息數據量急劇增長的情況下,生物信息學推薦系統將發揮強大的優勢。
1推薦系統的工作流程
應用在不同領域的推薦系統,其體系結構也不完全相同。一般而言,推薦系統的工作流程[5]如圖1所示。
(1)信息獲取。推薦系統工作的基礎是用戶信息。用戶信息包括用戶輸入的關鍵詞、項目的有關屬性、用戶對項目的文本評價或等級評價及用戶的行為特征等,所有這些信息均可以作為形成推薦的依據。信息獲取有兩種類型[6],即顯式獲取(Explicit)和隱式獲取(Implicit),由于用戶的很多行為都能暗示用戶的喜好,因此隱式獲取信息的準確性比顯式高一些。
(2)信息處理。信息獲取階段所獲得的用戶信息,一般根據推薦技術的不同對信息進行相應的處理。用戶信息的存儲格式中用得最多的是基于數值的矩陣格式,最常用的是用m×n維的用戶—項目矩陣R來表示,矩陣中的每個元素Rij=第i個用戶對第j個項目的評價,可以當做數值處理,矩陣R被稱為用戶—項目矩陣。
(3)個性化推薦。根據形成推薦的方法的不同可以分為三種,即基于規則的系統、基于內容過濾的系統和協同過濾系統?;谝巹t的推薦系統和基于內容過濾的推薦系統均只能為用戶推薦過去喜歡的項目和相似的項目,并不能推薦用戶潛在感興趣的項目。而協同過濾系統能推薦出用戶近鄰所喜歡的項目,通過用戶與近鄰之間的“交流”,發現用戶潛在的興趣。因此本文所用的算法是基于協同過濾的推薦算法。
(4)推薦結果。顯示的任務是把推薦算法生成的推薦顯示給用戶,完成對用戶的推薦。目前最常用的推薦可視化方法是Top-N列表[7],按照從大到小順序把推薦分值最高的N個事物或者最權威的N條評價以列表的形式顯示給用戶。
2生物信息學推薦系統的設計
綜合各種推薦技術的性能與優缺點,本文構造的生物信息學推薦系統的總體結構如圖2所示。
生物信息學推薦系統實現的主要功能是在用戶登錄生物信息學網站時,所留下的登錄信息通過網站傳遞到推薦算法部分;推薦算法根據該用戶的用戶名從數據庫提取出推薦列表,并返回到網站的用戶界面;用戶訪問的記錄返回到數據庫,系統定時調用推薦算法,對數據庫中用戶訪問信息的數據進行分析計算,形成推薦列表。
本系統采用基于近鄰的協同過濾推薦算法,其結構可以進一步細化為如圖3所示。算法分為鄰居形成和推薦形成兩大部分,兩部分可以獨立進行。這是該推薦系統有別于其他系統的優勢之一。由于信息獲取后的用戶—項目矩陣維數較大,使得系統的可擴展性降低。本系統采用SVD矩陣降維方法,減少用戶—項目矩陣的維數,在計算用戶相似度時大大降低了運算的次數,提高了推薦算法的效率。
(1)信息獲取。用戶對項目的評價是基于用戶對某一個項目(為表示簡單,以下提及的項目均指網站上的生物物種)的點擊次數來衡量的。當一個用戶注冊并填寫好個人情況以后,系統會自動為該用戶創建一個“信息矩陣”,該矩陣保存了所有項目的ID號以及相應的用戶評價,保存的格式為:S+編號+用戶評價,S用于標記項目,每個項目編號及其評價都以“S”相隔開;編號是唯一的,占5位;用戶評價是用戶點擊該項目的次數,規定其范圍是0~100,系統設定當增加到100時不再變化。這樣做可防止形成矩陣時矩陣評價相差值過大而使推薦結果不準確。(2)信息處理。信息處理是將所有用戶的信息矩陣轉換為用戶—項目矩陣,使用戶信息矩陣數值化,假設系統中有M個用戶和N個項目,信息處理的目的就是創建一個M×N的矩陣R,R[I][J]代表用戶I對項目J的評價。
(3)矩陣處理。協同過濾技術的用戶—項目矩陣的數據表述方法所帶來的稀疏性嚴重制約了推薦效果,而且在系統較大的情況下,它既不能精確地產生推薦集,又忽視了數據之間潛在的關系,發現不了用戶潛在的興趣,而且龐大的矩陣增加了計算的復雜度,因此有必要對該矩陣的表述方式做優化,進行矩陣處理。維數簡化是一種較好的方法,本文提出的算法應用單值分解(SingularValueDecomposition,SVD)技術[8],對用戶—項目矩陣進行維數簡化。
(4)相似度計算。得到降維以后的用戶矩陣US,就可以尋找每個用戶的近鄰。近鄰的確定是通過兩個用戶的相似度來度量的。本文采用Pearson相關度因子[9]求相似度。(5)計算用戶鄰居。該方法有兩種[10],即基于中心的鄰居(Center-BasedNeighbor)和集合鄰居(AggregateNeighbor)。本系統采用了第一種方法,直接找出與用戶相似度最高的前N個用戶作為鄰居,鄰居個數N由系統設定,比如規定N=5。
(6)推薦形成。推薦形成的前提是把當前用戶的鄰居ID號及其與當前用戶的相似度保存到數據庫中,而在前面的工作中已找出各用戶的鄰居以及與用戶的相似度,推薦形成部分只需要對當前登錄用戶進行計算。推薦策略是:對當前用戶已經訪問過的項目不再進行推薦,推薦的范圍是用戶沒有訪問的項目,其目的是推薦用戶潛在感興趣的項目;考慮到系統的項目比較多,用戶交互項目的數量很大,所以只篩選出推薦度最大的N個項目,形成Top-N推薦集,設定N=5。
3生物信息學推薦系統的實現
生物信息學推薦系統的實現可以用圖4來表示。數據庫部分主要存儲用戶信息和項目信息,用SQLServer2000實現。
數據訪問層實現了與用戶交互必需的存儲過程以及觸發器,也使用SQLServer2000,主要完成以下功能:初始化新用戶信息矩陣;插入新項目時更新所有用戶的信息矩陣;用戶點擊項目時更新該用戶對項目的評價;刪除項目時更新所有用戶的信息矩陣。用戶訪問層主要涉及網頁與用戶的交互和調用數據訪問層的存儲過程,在這里不做詳細的介紹。
推薦算法完成整個個性化推薦的任務,用Java實現。
(1)數據連接類DataCon。該類完成與SQLServer2000數據庫的連接,在連接之前必須要下載三個與SQLServer連接相關的包,即msutil.jar、msbase.jar和mssqlserver.jar。
(2)數據操作類DataControl。該類負責推薦算法與數據庫的數據交換,靜態成員Con調用DataCon.getcon()獲得數據庫連接,然后對數據庫進行各種操作。把所有方法編寫成靜態,便于推薦算法中不創建對象就可以直接調用。
(3)RecmmendSource與CurrentUserNeighbor。這兩個類作為FCRecommand類的內部類,RecmmendSource用于保存當前用戶的推薦列表,包括推薦項目號和推薦度;CurrentUserNeighbor用于保存鄰居信息,包括鄰居ID號、相似度及其訪問信息。
(4)協同過濾推薦算法FCRecommand。該類實現了整個推薦算法,主要分為鄰居形成方法FCArithmetic和推薦形成方法GenerateRecommend。
下面給出方法FCArithmetic的關鍵代碼:
Matrixuser_item=this.User_Item_Arry();//獲取用戶—項目矩陣
user_item=this.SVD_Calculate(user_item);//調用SVD降維方法
Vectorc_uservector=newVector();//當前用戶向量
Vectoro_uservector=newVector();//其他用戶向量
Vectorc_user_correlate_vector=newVector();
//當前用戶與其他用戶之間相似度向量
for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));
//1.獲得當前用戶向量
for(intk=0;ko_uservector.clear();
for(intl=0;lo_uservector.addElement(user_item.get(k,l));
//2.獲得其他用戶的向量
//3.計算當前用戶與其他用戶的相似度
usercorrelativity=this.Correlativity(c_uservector,o_uservector);
c_user_correlate_vector.addElement(usercorrelativity);
}
//4.根據當前用戶與其他用戶的相似度,計算其鄰居
this.FindUserNeighbor(i,c_user_correlate_vector);
}
根據鄰居形成方法FCArithmetic,可以得到每個用戶的鄰居。作為測試用例,圖6顯示用戶Jack與系統中一部分用戶的相似度,可以看出它與自己的相似度必定最高;并且它與用戶Sugx訪問了相同的項目,它們之間的相似度也為1,具有極高的相似度。
4結束語
在傳統推薦系統的基礎上,結合當前生物信息學網站的特點,提出一個基于生物信息平臺的推薦系統,解決了傳統生物信息網站平臺信息迷茫的缺點,為用戶推薦其感興趣物種的DNA或蛋白質序列。
優點在于協同過濾的推薦算法能發現用戶潛在的興趣,能促進生物學家之間的交流;推薦算法的鄰居形成與推薦形成兩部分可以單獨運行,減少了系統的開銷。進一步的工作是分析生物數據的特點及生物數據之間的關系,增加用戶和項目數量,更好地發揮推薦系統的優勢。
參考文獻:
[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.
[2]陳新.生物信息學簡介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.
[3]林毅申,林丕源.基于WebServices的生物信息解決方案[J].計算機應用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次數據庫建立及應用[J].計算機系統應用,2004(11):58-60.
[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.
[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.
[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.
[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.
關鍵詞:生物信息學;教材;師范院校
20世紀80年代末以來,生物信息學以驚人的發展速度,獲得了很多突破性成就,正日益成為生命科學在21世紀發展的核心內容。對于未來生物科學中堅力量的現代生物科學工作者而言,掌握生物信息學的相關知識尤為重要。
作為一門新興的課程,生物信息學課程在全國很多高等院校都已經開設,并進行了一些卓有成效的探索和改革。我們結合自身的教學實踐和相關學校的教學現狀,對師范院校生物信息學課程教學內容、師資力量、教學模式和方法、跨學科合作、教學實踐實施情況等方面的現狀進行了積極分析和思考。目前,師范院校生物信息學教學的現狀如下。
一、教學內容陳舊、教學資源缺乏
生物信息學是一門新興的學科,在高等院校開設時間較晚,我國對生物信息學專業精品課程的建設方面投入不夠,成熟的生物信息學教學大綱、教案、多媒體課件、教學視頻和習題等教學資源稀少。目前,市場上也缺乏相關的生物信息學教學多媒體課件和音像制品輔導材料等相關產品,造成生物信息學教學資源匱乏的現狀。
目前師范院校所用教材大多數是徐程主編的《生物信息與數據處理》,蔣彥等編著的《基礎生物信息學及應用》等幾種不同版本的教材。這些教材在知識性、科學性和系統性方面還行,但是在教學內容的新穎性、時效性和實踐性以及生物相關背景的介紹和對師范院校的適用性等方面有所欠缺。生物信息學的知識日新月異,新的數據庫、新的軟件、新的算法層出不窮,而生物信息學的課堂往往不能及時地將最新進展呈現給學生,導致課堂內容陳舊,不利于學生的發展和對生物信息知識的合理掌握,從而影響了生物信息學教學的質量。
二、師資力量缺乏
生物信息學是一門新興的交叉學科,需要熟練掌握計算機與生物學知識的老師來授課。然而,實際上,由于缺少生物信息學的專業教師,教授該學科的教師多為生物學其他課程兼任,這些老師往往缺乏專門的生物信息學訓練,在知識的傳授和應用方面存在欠缺。與生物信息學教學要求存在著較大的差距,不能很好地滿足教學大綱的要求。另外,師范院校通常將生物信息學作為選修課來開設,該課程在專業建設和人才培養方案中的地位偏低,造成相關部門對師資培養不夠重視。
三、教學模式和方法落后
由于生物信息學課程涉及大量的數據庫和軟件知識,教師普遍采用多媒體教學。而多媒體課件的容量通常很大,學生忙于筆記,難以把握重難點。同時,幻燈片展示的知識點猶如放電影一般一閃而過,學生沒有足夠的時間思考和消化,跟不上教師的進度。教師進行多媒體教學時,往往是一堂課上從頭講到尾,語調缺乏抑揚頓挫,沒有起伏,學生很容易昏昏欲睡。因此,教師雖然使用的是先進的教學工具,采用模式的卻是傳統的灌輸式教學,只管埋頭照本宣科,不管學生接收領悟多少。學生為了達到期末考試標準,只顧死記硬背,這樣的教育讓學生失去創新精神和主動思考的能力,失去對生物信息課程的興趣。
四、缺乏與相關學科的合作交流
生物信息學實際上是生物學與計算機科學的交叉學科。然而一般高校往往只在生命科學學院開設生物信息學,由生物學老師來擔任授課老師。由于對計算機科學知識的缺乏,導致生物專業教師對生物信息學課程很難深入開展;另一方面,計算機科學專業由于沒有開設生物信息學課程,使學生不能了解到生物信息學的重要性,以及如何使計算機科學更快更好地發揮其在生物信息學中的作用??偟膩碚f,生物信息學課程的建設欠缺相關學科的協作,不能有效地整合資源,不利于培養復合型人才。
五、缺乏實踐教學內容
現有的生物信息學課程也有一些實踐內容,但實踐課時數少,內容相對簡單,缺乏系統完善的實踐過程。教師為學生講授具體知識時,通常只通過多媒體課件演示操作,并沒有為學生設置具體的動手操作步驟。使得學生對信息反饋遲鈍,印象不深刻,不容易掌握方法。生物信息學實踐教學并不需要價格昂貴的實驗設備,只需要一網的電腦和一些相關的分析軟件便可以進行實驗。然而,目前的狀況是,生物信息學課程中真正開展實踐性教學的內容少之又少。
生物信息學的學習是一個長期積累的過程,教學水平的提高也需要在大量的教學實踐中不斷總結和完善。我們通過分析發現,在師范院校生物信息學教學中仍存在很多問題,其原因是多方面的,需要教學工作者進一步深入探討并提出切實可行的策略。
參考文獻:
[1]湯麗華.淺談大學本科生物信息學課程建設與教學[J].科技
信息,2010(1).
[2]賈小平,孔祥生.生物信息學實踐教學初探[J].陜西教育,
2010(3).
[3]軍.農學專業生物信息學課程教學改革探析[J].現代農
業科技,2010(5).
[4]郝新保.充分利用網絡資源開展生物信息學教育[J].中國醫
關鍵詞:生物信息學;考試;網絡
生物信息學(Bioinformatics)是建立在分子生物學的基礎上,隨著20世紀90年代人類基因組計劃的實施以及高通量自動化測序技術的應用而誕生的。生物信息學是以DNA和蛋白質序列等數據為核心,綜合運用高等數學、計算機科學和生物學工具,通過數據庫的建立、生物學數據的檢索、生物學數據的處理、生物學數據的利用(計算生物學)等,以達到詮釋數據中的生物學意義的目的。目前生物信息學的主要的研究方向有:序列比對、基因識別、基因重組、蛋白質結構預測、基因表達、蛋白質反應的預測,以及建立進化模型等。[1,2]生物信息學作為一門新型交叉學科,我國很多高校先后在生物科學、生物技術和基礎醫學等專業開設了生物信息學課程。此外,北京大學、清華大學和浙江大學等部分高校還在高校招生中增設了生物信息學專業。按照教學規律,生物信息學是在學生掌握生物化學、遺傳學、分子生物學以及計算機應用等相關知識的基礎上開設的。通過生物信息學課程的學習,不僅可以加深對分子生物學和基因工程等課程的理解,而且可以為進一步學習基因組學(Genomics)和蛋白質組學(Protemics)奠定基礎。[3]我校在國內較早地涉足該課程的教學工作,筆者于2007年開始在生物技術和生物科學專業本科生中開設了生物信息學課程,其中生物技術專業作為必修課程,生物科學專業列為選修課程。對本科生而言,通過該課程的學習,要求獲得如下生物信息學的知識和技能:(1)熟練掌握和使用生物信息學中的相關數據庫,包括DNA序列數據庫、蛋白質序列和結構數據庫、已測定全序列的動植物和微生物的完整基因組數據庫以及國內外文獻數據庫。(2)熟練掌握DNA和蛋白質序列的同源性比較和分析。(3)能分析DNA序列轉錄翻譯成氨基酸序列的結構和功能。(4)熟練掌握生物信息學常用的分析軟件。實際操作能力是生物信息學教學過程中需要重點培養的能力。另一方面,考試是對學生知識和能力的一種測量,它的功能是量化學生的知識和能力,以及通過考試促進學生的知識和能力的增長提高??荚囀墙虒W過程中的一個重要的環節,是檢查學生對所學知識的掌握程度、應用所學知識的綜合能力及衡量教師教學效果的主要形式,它可以督促學生全面系統地復習和鞏固所學的知識和技能,是評定學生成績的有效手段??茖W、合理的考試,可以使學生明了學習的差距,自動調節學習方向,充分發揮學生學習的主觀能動性,教師亦可通過考試了解教學效果,調節和改進教學內容和教學方法,充分發揮考試的導向作用,提高教學質量。[4,5]
一、常規考試方法在生物信息學課程考試中存在的問題
常規傳統的考試方式是每位學生使用同一份完全同的試卷,在同一時間中進行考試。對于生物信息學課程來說,由于其課程的特點所限,在考試整個過程中,為了完成試卷中操作題的解答,需要使用聯網的計算機,因此,生物信息學課程常規的考試方式是每位學生發給考題完全相同的紙質試卷,學生將答案寫在紙質的考卷上,其中操作題利用聯網的計算機完成操作后將答案寫在紙質的試卷上。我們自2007年開始經過5年的教學實踐發現,常規傳統的考試方法存在一些亟待解決的問題。由于參加考試的每位學生是同一份完全相同的試卷,同時考試過程中必須使用聯網的計算機,根據考試結果中出現少量完全雷同的卷面顯示,雖然考試過程中有監考教師的嚴格監督和巡查,依然有少量的學生通過計算機聯網的及時在線信息系統,如:QQ、MSN、e-mail等,相互傳遞試題的答案并進行比對,因此,在客觀上難以徹底杜絕考試作弊現象。鑒于這種情況,迫切需要探索一種新的考試方式,克服傳統考試方式的局限性,以適應生物信息學課程的特點和需要,達到更加客觀、科學、公正地評價學生考試和課程成績的目的。
二、新的考試方法的探索——網絡考試系統的構建
為解決上述生物信息學課程考試中出現的問題,筆者構建了生物信息學網絡考試系統,以便替代傳統的考試方法(圖1)。本考試系統具有以下特點:
第一,建立較大容量的試題庫。試題庫中題型包括選擇題、判斷題、簡答題和操作題等四種題型,分別含有500、100、50和50道題。每套完整的試題滿分為100分,其中設置為選擇題50分(每題1分,共50小題)、判斷題10分(每題1分,共10題)、簡答題20分(每題5分,共4題)、操作題20分(每小題10分,共2題),每套試卷也可以根據考試需要重新設置每種題型的分值和題目數量。試題庫題目主要以《基礎生物信息學及其應用》和《簡明生物信息學》等教材為依據。[6,7]題庫中的題目考核內容涵蓋教材的所有章節和主要知識點,其中的操作題目覆蓋課程的重點教學內容。
第二,自動隨機組卷。隨機組題方式設置2種,一是全體參加考試的學生試卷中所有試題都相同,但每道題目的題號前后順序有別;二是每位學生的試卷中不僅試題的題號順序不同,而且試題也不完全相同。兩種組題方式各有利弊,前者能保證每位學生的試卷難度系數完全相同,但只是學生的試卷中試題的順序不同,題目依然還是相同的;后者則能保證徹底杜絕參加考試的學生通過互聯網比對試題答案的可能,但由于每位學生的試題不同,因此可能導致不同的學生之間的試題難度系數存在一定的差異。兩種不同的組題方式還有待在今后的教學實踐中進行比較和科學選擇。
第三,自動閱卷和人工閱卷方式相結合。閱卷方式中設置客觀試題(包括選擇題和判斷題)自動閱卷和自動評分,主觀題(包括簡答題和操作題)采用在計算機上人工閱卷。同時也留有全部設置為人工閱卷的后臺操作系統。
第四,考試時間設置倒計時??梢园凑諏W校的考試時間安排,設置固定時長的考試時間,考試開始后設置的固定時長開始倒計時,到點后自動保存試卷和答案并關閉考試系統。參加考試的學生也可以點擊按鈕保存試卷和答案提前交卷。此外,考試系統主界面還設置了課程的一些相關信息(如授課教師、學校名稱、課程簡介等),并設置將來將考試系統轉入網絡課程一部分的鏈接,為將來進一步改進和發展該考試系統提供了窗口。
科學、合理、公正的考試,對課程教學可以起積極促進作用,激發學生學習的積極性,培養學生的創新能力,有利于學生個性的發展;反之,則不僅不利于教學,而且會挫傷學生學習的積極性和自尊心,阻礙學生創造力和個性的發展。筆者構建的網絡自動組題的生物信息學考試系統能較好地實現生物信息學課程的客觀公正的考試,在客觀上徹底杜絕考試作弊現象的發生,達到科學檢測學生對生物信息學課程基礎知識和操作能力掌握的情況,客觀公正地評價學生的考試成績和課程成績。
參考文獻:
[1]戴凌燕,姜述君,高亞梅.《生物信息學》課程教學方法探索與實踐[J].生物信息學,2009,7(4):311-313,319.
[2]張紀陽,劉偉,謝紅衛.生物信息學課程研究性教學的實踐與思考[J].高等教育研究學報,2011,34(4):51-53,57.
[3]向太和.我國現有《生物信息學》教材和網絡資源的分析[J].杭州師范學院學報(自然科學版),2006,5(6):495-498.
[4]趙晴.考試方法改革的研究與實踐[J].中山大學學報論叢,2001,21(1):144-146.
[5]高艷陽,張峰.高校考試方法改革研究綜述[J].理工高教研究,2003,22(6):100-101.
[6]蔣彥,王小行,曹毅,等.基礎生物信息學及其應用[M].北京:清華大學出版社,2003.
[7]鐘揚,張亮,趙瓊.簡明生物信息學[M].北京:高等教育出版社,2001.
生物信息學教學模式探索任務引領生物信息學是用數理和信息科學的觀點、理論和方法研究生命現象、組織和分析呈現指數增長的生物醫學數據的一門學科,它是生物醫學、數學、信息科學以及計算機科學等諸多學科的嶄新交叉學科。生物信息學幾乎是今后所有生物(醫藥)研究開發所必需的工具。
21世紀是生物科學的世紀。近年,我國生物技術公司對生物信息學人員的相關需求也迅速增加,浙江理工大學生命科學學院生物技術專業在進行了行業調研并進行專業課程體系構建研究后,于2006年定位和開設了生物信息學課程。該門課程經過8年多的建設后,對教學團隊的建設、課程目標的設定、教學內容及教學教法的選擇等方面進行了卓有成效的探索,這些探索所形成的結論,可為即將開設或正在進行該課程教學改革的學校提供可借鑒的經驗。
一、生物信息學的課程特點
諾貝爾獎獲得者W.Gilbert1991年提出了這樣一個觀點:傳統生物學解決問題的方式是實驗的,而現在,基于全部基因都將知曉,并以電子可操作的方式駐留在數據庫中,新的生物學研究模式的出發點應是理論的,是一個科學家先從理論推測出發設定研究目標,然后再回到實驗中去追蹤或驗證這些理論假設。而生物信息學研究正是從英特網上源源不斷地采集數據,進行分析、歸類與重組,發現新線索、新現象和新規律,用以指導實驗工作設計,是一條既快又省的研究路線。它對于找尋一個研究項目的突破口是非常重要的,選定合適的研究出發點,可避免許多不必要的重復,最大程度節約研究資源,使研究成果最大化。鑒于該門技術對生物科學的理論、實踐要求以及對信息技術掌握的要求,生物信息學課程與其他課程的教學有很大不同。
1.在課程目標定位中,提高學生對相關網絡資源的使用能力是該門課程的重要目標之一。學生必需使用強大的搜索功能實現數據儲存、檢索和分析,學校在教學資源配置上必需向此傾斜。
2.該門課程學科交叉性強,所涉及的生物及計算機等學科的相關知識更新都很快,導致其理論和實踐內容不斷推陳出新,這使得在教學內容選擇上要緊跟這些更新,不斷進行調整。
3.課程教學實踐性強,同時涉及生物技術專業實踐和計算機應用技術的實踐,這需要教師在授課過程中根據學生的學習規律合理安排實踐項目,發揮好這兩種技術的協同作用。
二、生物信息學課程教學模式探索
1.教學目標與其所培養學生的核心技能
合理的課程目標與定位是決定課程建設成敗和教學效果的基礎,其主要依據是人才培養需求與授課對象的實際情況。經過對該門課程教學對象的研究發現,在生物專業課程體系下培養的本科生,其前導課程主要集中在生物領域,通常沒有系統的學習過計算機、信息技術、編程等知識。對信息檢索、模型建立、軟件的識別及應用的能力相當薄弱。因此,本門課程將提高學生的信息技術能力也作為一個重要的課程目標。學生在本門課程中將學習與生物技術相關的各種數據庫和軟件的使用。當然,對學生信息技術能力的要求也定位在能使用、會使用就行,不需要將學生掌握生物數據庫構建和軟件開發作為課程教學的目標。
在課程目標的設定過程中,應牢記高校對文化的傳承的功能,要使學生了解生物信息學發展的歷程。在生物信息學學科發展過程中所涌現出來的著名學者,眾所周知的震撼人心、啟迪心靈的奇聞秩事,能使學生對這門課程產生濃厚的興趣,甚至更深刻地領會這門課程的含義。
熟練掌握生物數據庫的檢索和使用是生物信息學課程教學的首要目標。到目前為止,生物學數據庫總數已達500個以上,在DNA序列方面有GenBank、EMBL和DDBJ等;在蛋白質一級結構方面有UniProt、SWISS-PROT、PIR和MIPS等;在蛋白質和其他生物大分子的結構方面有PDB等;在蛋白質結構分類方面有SCOP和CATH等。各數據庫均通過Internet提供多種形式的數據檢索服務。例如,NCBI-GenBank數據庫就提供Retrieve(Email),Entrez(Web集成信息檢索)及Query(Email集成檢索)等多種方式的檢索服務。這類檢索服務是生物數據庫所能提供的多種服務中最基本的信息共享和應用服務,也是生物專業學生和科研工作者經常使用的。在教學過程中需通過設計檢索任務來完成對這些數據庫使用方法的學習,如通過生物數據庫檢索家蠶profilin基因的相關信息。
增強學生使用生物信息處理軟件的能力,是生物信息學課程教學的重要目標。在世界各地,科學家每天都要通過序列比對軟件進行成千上萬次的序列比對。學生需要通過課程的學習熟練掌握各種生物信息處理軟件,有時還有必要進行一些簡單程序的設計,進而掌握發現新線索、查找新規律的工具。例如,目前,借助于生物信息手段的蛋白質預測是提供蛋白質結構及功能信息的重要方法,對這種預測方法的學習將使學生更多更快地了解蛋白質的信息,加深對生物技術科學的理解和運用。除了生物數據庫和生物軟件使用學習外,還要著重體現生物學文獻調研和閱讀、論文撰寫等基本能力的訓練,如EndNote文獻管理軟件的使用。
2.教學內容選擇和教學順序的組織
生物信息學的課程教學內容的選擇,要緊隨生物信息學的發展方向,涵蓋最前沿知識和最先進技術領域。與此同時,教學內容的選擇還應充分考慮學生基礎和對該門課程的需求。生物信息學選課學生通常有兩類,一類是具有較為扎實的生物學基礎的學生,他們學習目的非常明確,其學習重點在于提高對生物信息實驗所得結果的分析解釋和驗證能力。另一類是生物學基礎相對較弱的學生,這些學生主要是為了了解生物信息學發展前沿、掌握檢索能力以及初步的分析技能,對分析、處理、預測結果的驗證涉及不多。無論哪種學生,都比較欠缺信息技術方面的知識,因此,這類知識在前面部分介紹。而后面部分則隨學生的類型有所改變,我們根據授課學生的分類選擇不同的授課內容和授課重點,嘗試據此來劃分教學組織的各個階段,在每個教學節點精心設置任務(如表1所示)。
與其他課程的教學一樣,生物信息學課程的教學需遵守學生對知識的掌握規律,其內容的選擇與安排應按照循序漸進的原則。從第一階段到第二階段,教學內容“由易到難”。隨著教學過程的深入,課程內容更側重于對生物信息學某一專業領域的引導,此時授課教師的指導更加重要,這類領域往往與開課院系專業的優勢研究領域和導師研究方向相結合。
3.課程教學方法的改革
生物信息學是一門涉及知識面深刻而廣泛,學生獨立自學的難度很大的交叉科學。依據建構主義教學理論的特點,這類難度大、技術性和實踐性強的課程要特別重視以學生為教學主體的教學方法,應嘗試從任務引領入手,將生物信息學的一些重要學習內容逐步展現出來。
在生物信息學教學中,教學內容側重于任務引領,設定與學生生活相貼近的、接合學科發展前沿的引領任務。例如,可以從高水平雜志(Nature、Science)上根據任務引領的關鍵詞搜索綜述,根據綜述總結出該任務發展脈絡,提煉教學任務,將較為抽象的計算機算法、生物學基礎知識融于任務中,使學生有積極參與的意愿。及時將任務相關工具提供給學生,或是提前引導學生自己查詢工具,使學生有完成任務的基礎。
學生在每個節點都非常清晰地知道下個節點的主題,并在完成教師的任務過程中,構建局部知識框架,形成自己的見解。教師需在課堂上和課堂以外及時掌握學生對各個節點知識的掌握情況,找到學生的最近發展區,針對重點、難點解惑,提高教學效果。這樣可以使選擇的教學任務吸引學生、引領學科前沿,還能在教學過程與學生的互動中有效地實現教學相長。
4.重視切合課程設計的教材編寫
生物信息學不同于其他學科,其很多內容和知識節點更新很快,很多最新成果必須教師根據生物信息學發展前沿及時整理和總結,其教學內容設置著重于保證教學內容的先進性和前沿性。教材的更新和修訂周期較短,幾乎每學期均需要重新修訂。
2001年,教育部在[2001]4號文件中明確要求直屬高校的“本科教育要創造條件使用英語等外語進行公共課和專業課教學”,在信息技術、生物科學、管理、金融、法律等專業力爭在3年內使外語講授的課程達到所開課程的5%~10%,尤其強調了生物科學更要先行一步?,F實情況也使英文自編教材的編寫刻不容緩,現在,絕大部分前沿生物數據信息(最主要的核酸和蛋白質)數據庫均為全英文操作界面,操作者只有熟練掌握生物信息學英文術語才能自如地使用該系統,才能更有效的進行生物信息學的學習和研究工作。在英文自編教材編寫時,理論部分的參考書我們精心應選定了具有非常嚴謹理論體系和反應了最前沿生物信息技術的《BIOINFORMATICS:Databases,Tools, and Algorithms》。編寫時需要特別注意應依據教學設計來設定來序化任務,突出不同教學階段的教學重點,使學生學習過程是個循序漸進的過程。我校采用的自編教材根據教學階段共設置五個引領任務:
(1)Pubmed檢索profilin基因研究進展;
(2)家蠶profilin基因結構分析與PCR擴增引物的設計;
(3)家蠶profilin基因同源序列的獲取與進化樹的構建;
(4)家蠶profilin蛋白二級和三級結構的模擬;
(5)家蠶profilin蛋白理化性質和功能位點的分析.
5.合理配置網絡資源和多媒體教學資源
首先,學會利用互聯網、計算機、數據庫和應用軟件進行生物信息分析的基本方法和技能本身就是生物信息學教學重點。以往普通的多媒體教室已難以提供一個交互式的網絡化、信息化的教學環境,如果想上好生物信息學這門課程,網絡資源和多媒體教學資源的應用,將貫穿于整個生物信息學課程(從任務下發及申領、任務控制及執行、任務完成結果檢驗與反饋)的整個教與學的過程。而我們通過極域電子教室和學校4A網絡教學平臺結合,較好的實現了生物信息學交互式的網絡化、信息化的教學環境。
課前,教師通過網絡平臺將任務教學內容、任務序列、工具等傳遞給學生,學生通過登陸互聯網絡,利用網絡資源和軟件嘗試完成預習任務。此處可以設置學情反饋點,教師通過網絡論壇等形式掌握學生預習情況。授課過程中,教師利用教師機客戶端的文件分發系統將任務教學內容、任務序列、工具等發送到學生桌面,再通過廣播教學多媒體技術為學生形象的講解任務內容以及完成方法。每位學生在教師的監督下在互聯網上執行任務。教師在監控學生完成任務過程中,不斷的得到學生任務進程的反饋,對于任務中學生出現共性問題,利用網絡、廣播教學或演示等形式及時解決。課下,學生同樣可通過學校4A網絡教學平臺將任務報告、作業、問題和意見等反饋給教師,教師在平臺上批改任務報告后將成績和評語發送給學生,讓學生及時了解自己的學習情況,師生還可以通過平臺中的網絡論壇進行問題討論等。網絡環境下的生物信息學任務引領式教學,不僅能提高學生的學習興趣,還能創造更為有效的師生互動信息教學環境。
三、結束語
經過多年的生物信息學教學實踐發現,如果想建設好生物信息學課程,我們需要設定非常清晰的教學目標,理清課程需要培養學生的核心技能;結合行業發展的技術前沿精心選擇教學內容,合理序化教學順序;要依據建構教學理論,重視以學生為教學主體的教學方法,嘗試從任務引領入手引領學生學習,提高學生的學習興趣;要重視切合課程設計的教材編寫,理論部分引自精選英文參考書,設計教材結構應切合任務引領的教學方法;合理配置網絡資源和多媒體教學資源,加強學生互動,為成功地實現“反轉課堂”提供保障。
參考文獻:
[1]張林,柴惠.現代教學手段在生物信息學教學中的應用[J].新課程研究,2011,219(4):156-158.
[2]柴惠,趙虹,張婷.高等院校生物信息學雙語教學課程建設之我見[J].中國高等醫學教育,2010,(4):83-84.
[3]Gilbert,W.Towards a paradigm shift in biology[J].Nature,1991,(349):99.
[4]劉偉,張紀陽.“生物信息學”課程中研討式教學實踐[J].中國電力教育,2012,(23):60-61.
[5]范丙友,賈小平,胥華偉.生物信息學課程教學改革與探索[J].大學教育,2013,(16):61-62.
關鍵詞:生物信息學;生物技術;教學改革
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2014)36-0197-03
一、生物信息學課程的教學背景
生物信息學(Bioinformafics)是一門集數學、計算機科學以及生物學等多學科交叉而形成的新興熱點學科,實質就是利用信息科學與技術解決生物學問題。它的內涵目前包含了分子生物大數據的獲取、加工、存儲、分配、分析、解釋等在內的所有方面。依據分子生物大數據的類型不同,生物信息學的數據對象分布在基因組、轉錄組、蛋白質組等不同水平層次的數據以及跨層次的轉錄調控、轉錄后調控和表觀遺傳修飾等縱向連接。依據學科任務的不同,生物信息學一方面要組織好生物大數據的儲存和獲取,一方面要開發優良的算法和工具軟件對生物大數據教學分析,同時還要利用這些生物大數據和工具來產生新的生物學認識,為下游的濕實驗生物學家提供理論依據和指導。近年來,隨著高通量生物大數據檢測技術,如基因芯片技術、高通量測序技術等的發展,生物信息學已經在生物、醫學、藥物開發、環境保護以及農業應用等眾多領域普及推廣了起來。大量的生物數據急迫地需要處理,相應地產生了對生物信息專門人才的廣泛需求。
因此,《生物信息學》課程也快速地在各院校大學生教學中開展了起來,甚至在局部高校產生了生物信息學本科專業。然而在實際的教學中也伴隨著種種問題,影響了該課程的教學效果。本文現就近年來在生物背景的學生中所開展的生物信息學的教學實踐淺談一點體會,對其存在的問題和對策作一論述。
二、生物信息學課程教學改革
(一)教學內容特點
生物信息學屬于多學科交叉學科,需要在分子生物學、遺傳學、高等數學以及計算機編程等的課程基礎上進行講授。不同學科基礎以及不同來源的生物數據反映在教學內容上,生物信息學的一個特點就是信息量大。它囊括了概率統計、計算機語言、人工智能和機器學習、生物數據庫介紹、序列比對、分子進化分析、基因組序列分析、基因注釋與功能分類、基因表達譜分析、蛋白質表達與結構分析、生物分子網絡以及計算表觀遺傳學等眾多的內容模塊。
從歷史發展角度看,這些內容以基因組測序為主體,生物信息學的發展可以劃分為3個階段:前基因組時代、基因組時代以及后基因組時代(又稱為功能基因組時代)。以人類基因組計劃的完成為時間節點標記,目前的生物信息學已經進入到了功能基因組學時代。因此,體現在當前的生物信息學教學內容上的另外一個特點就是“新”。
(二)教材的選擇
生物信息學教學內容的以上特征要求在教材的選擇上更需要全面衡量考慮。由于對生物信息學知識的大量需求,目前教材市場上的相關書籍也琳瑯滿目,選擇余地較大。我們推薦的教材是科學出版社2010年第二版的Instant Notes Bioinformatics,由T. Charlie Hodgman等人編寫[1]。這本書的教學內容以基因組的生物信息學分析為主體,兼顧概率統計、機器學習、代謝組學等數理基礎知識和后續功能基因組分析。其中尤以序列比對、打分矩陣、系統發育樹的構建分析為核心內容。這種課程設置把龐大的生物信息學體系縮小集中在了序列分析部分,這樣既便于學生系統充分地掌握生物信息學知識,又兼顧了學科的發展基礎和趨勢。
另外,本教材為英文教材,這適應了生物信息學快速發展的要求,讓學生近距離地體驗到學科前沿氣息。為了擴大學生的知識渠道來源,我在教學中推薦了幾種不同類型的參考書籍。其中,David W. Mount編寫的《Bioinformatics Sequence and Genome Analysis》和本校陶士珩教授主編的《生物信息學》,在教學內容以及體系上均和本教材較為相近[2,3]。喬納森.佩夫斯納著,孫之榮主譯的《生物信息學與功能基因組學》則更側重功能基因組學的內容[4]。李霞主編的《生物信息學》在內容全面、豐富的同時,也較為側重功能基因組學的內容,同時還強調在醫藥衛生領域的應用和研究熱點[5]。
該書使用了彩印版,同時伴有光盤、習題集以及參考答案,目前在教材市場上較為受歡迎。最后,考慮到生物學背景的學生在計算機實際動手能力方面相對較為弱勢,我在教學中還特別推薦了幾本結合生物信息學與編程語言的書籍供同學們課后學習。這些教材包括:A.基于Perl語言的《Beginning Perl for Bioinformatics》、《Mastering Perl for Bioinformatics》;B.基于R語言的《R Programming for Bioinformatics》;C.基于Python語言的《Bioinformatics Programming Using Python》[6-9]。
(三)學時和考核方式的設定
生物信息學課程盡管面臨學科發展的迫切需要,教學內容廣泛而眾多,但由于大學本科生的學時學分限制,目前我們的相關教學僅包括32學時的理論學時以及兩周的生物信息學實習。為了彌補學時不足的限制,我們更突出強調了實際表現的考核方式??己顺煽冎械钠綍r成績由30%上升到40%,包括平時表現、隨堂測驗以及課后作業等。
(四)存在的主要問題與解決辦法
1.激發興趣。由于所教授的學生為生物學背景,不少學生均對數學、計算機等數理課程較為恐懼,缺乏學習興趣和韌性。這是本課程講授過程中所面臨的第一大問題。為此,我嘗試了多種教學辦法進行解決,取得了一定的效果。
(1)去除學生的恐懼心理。從心理學上講,恐懼的形成源于過去失敗經歷的陰影以及對于未知事物的不確定性。因此,我在教學中注意突出生物學在生物信息學中的重要地位,以生物信息學領域的成功科學家為例,破除以往失敗經歷的陰影。同時,適當地濃縮教學內容,降低學生對未知事物不確定性的恐懼。
(2)激發學習生物信息學的熱情。通過教學的互動,讓學生在互動中消除對生物信息學的陌生感,熟悉生物信息學,激起學習的欲望。
(3)在學習中感受生物信息學發展的脈搏。通過介紹生物信息學的發展史,對比歷史上類似的科學發展歷程,讓學生深刻地領悟到當前的生物信息學在學科史中的定位。
(4)在實踐中感受生物信息學的魅力。比如,在進行系統發育樹構建的講授中,同學們可以看到由于數學算法的使用,原本枯燥無味的序列數據居然能夠反映物種和基因的進化歷程。通過教學中的改革實踐,同學們的學習興趣有了較大的提升。
2.夯實基礎。生物學背景的學生另外一個特點是數理基礎和計算機語言編程能力相對較為薄弱。在教學過程中,我首先注意引導學生揚長避短,充分發揮學生在生物學理解能力上的優勢,避免進入基礎性的數學算法糾纏中。同時,讓學生認識到,作為一個交叉性的學科,生物信息學的上下游學科鏈較長,同學們可以根據自身條件選擇進入不同的環節。比如,擅長基礎性的算法工具軟件開發的同學可以進入上游的理論環節,擅長生物學理解的同學可以使用這些工具進入下游的生物信息應用領域。第三,在課程設置上,著重加強生物信息學方向的數理基礎課程,比如生物統計、Linux以及Perl語言等,改善生物技術專業的學生在生物信息學方向的薄弱環節。最后,向同學們強調,注意在學習的過程中提高學習能力才是根本。讓同學們意識到,基礎不是問題,只要提高了學習能力,持之以恒地去實踐,均能學好本門課程。
3.緊跟前沿。生物信息學是一門前沿性很強的學科。為了既能提高學生的知識水平,又提高學生的學習能力,這就要求在教學中既要恰當地剪裁知識結構和體系,又要有提供充分的學習鍛煉空間。為此,我們將課程設置為雙語課程,這樣做的好處是既不耽誤知識的學習,又能適當地提高學生的適應能力,為學生在將來英文環境較普遍的生物信息學領域中的學習研究應用打下扎實基礎。同時,為了更適應將來學生對生物信息的使用環境,同時也為了降低難度,我們的雙語課程更側重閱讀、理解能力的提高,以避免簡化為英語學習課,和普通的英文課程內容的重疊。另外,前沿性很強的生物信息學處處蘊藏著創新的機會,在教學過程中,我注意鼓勵學生的創新意識。比如,學生在上課過程中的一些小想法,我鼓勵其大膽投入,形成研究性論文。
4.注重實踐性。生物信息學在教學中既要注重對學生思維方式的轉變的教育,形成用生物信息學去看待生物大數據的思想,而不僅僅是解決某個具體生物學問題的“小工具”,又要求學生在課程學習中具備一定的實踐能力。由于長久以來的教育體制和學習習慣的制約,同學們的學習重點仍然集中在知識的記憶、考試的應付上面,缺乏對實際動手能力的正確認識。這給生物信息學這門課程的教學,特別是實踐教學帶來了較大的壓力。為此,我在教學中著重采用身邊的典型案例教學法進行教學。比如,以往屆學生由于其突出的實踐能力最后促成了他畢業就業的成功為例,說明動手能力的重要性。貫穿在課程教學中,我對學生實驗課程的理念是鼓勵其獨立自主地完成實驗,盡量少干涉,允許其在實踐中犯錯誤,在犯錯中學習提高。經過思想觀念的轉變、實踐中的反復雕琢提高,學生們的實踐動手能力都得到了較好的提升。
三、結語
生物信息學是一門快速發展的新型熱門學科,其發展與生命科學發展是相輔相成的。本文針對《生物信息學》的教學進行了一些探討,特別是針對生物背景學生的教學進行了深入集中的研究。
本文認為,只有激發學生的學習興趣,夯實基礎,注重實踐動手能力,緊跟學科發展前沿趨勢,這樣才能切實做好生物信息學的課程教學工作,提高該課程的教學質量,以此滿足我國目前該領域對人才的教育需要,培養出具有一定的實踐操作能力和很強的創新能力的大學生。
參考文獻:
[1]T.Chalie Hodgman AF,David R. Westhead.生物信息學導讀版[M].北京:科學出版社,2010.
[2]Mount DW (2002) Bioinformatics Sequence and Genome Analysis:科學出版社.
[3]陶士珩.生物信息學[M].北京:科學出版社,2007.
[4]喬納森.佩夫斯納.生物信息學與功能基因組學[M].孫之榮,主譯.北京:化學工業出版社,2009.
[5]李霞.生物信息學[M].北京:人民衛生出版社,2010.
[6]Tisdall J (2001) Beginning Perl for Bioinformatics:O'Reilly.
[7]Tisdall J (2003) Mastering Perl for Bioinformatics:O'Reilly.
[8]Gentleman R (2008) R Programming for Bioinformatics:Chapman & Hall/CRC.
[9]Model ML (2009) Bioinformatics Programming Using Python:O'Reilly.