知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > 問題解答 >

生信分析常見錯誤習慣

時間:2017-11-17 13:36來源:原創 作者:森莘 點擊:
在生信分析中常常遇到一些習慣問題,這些問題是非常容易忽略的,同時也是非常重要的,長期做生信分析,需要特別學習其中幾個號習慣
文件夾和文件名
可能很多學員很不屑,文件名有什么好注意的,而恰恰當前很多咨詢的問題,看似很復雜,其實是非常簡單的 ,就是在生信分析時需要一律使用英文,英文的文件夾名,英文的文件名。這樣可以節省很多時間,避免很多錯誤。
在做GEO芯片分析,TCGA數據庫挖掘分析,SEER數據庫挖掘時,我們經常用到Perl語言,Perl作為一門編程語言,正則表達式的內置對于處理文本非常方便,而我們的生物信息就是保存大量系列的文本文件;而對于Perl的運行,如果熟悉的學員會知道,我們必須使用英文的文件名,否則很多Perl腳本在CMD環境下運行時會報錯的。所以做生信分析,需要養成一個好的習慣,把文件名規范,文件夾更加要規范,這不僅可以在操作上避免錯誤,也可以在數據查找時提高效率,也可以在二次開發時提供便利。
在TCGA數據下載和處理時,我們經常會用到TCGA數據庫官網提供的gdc下載工具,這個工具下載TCGA的數據是非常方便的,在這個步驟,有不少學員犯了錯誤,而且很難找到這樣一個不易察覺的錯誤,就是當文件夾有總問時,運行gdc工具是會直接報錯,而且這個錯誤已經有很多學員咨詢過,所以大家需要養成一個良好的習慣。
對于英文基礎一般的學員,可以用翻譯軟件,把自己需要命名的關鍵詞翻譯成英文,再作為文件夾和文件的名稱,這對于文件整理和處理都是非常有好處的。

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學課堂
BioWolf二維碼生成器
頂一下
(1)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
GEO芯片數據庫挖掘生信視頻教程
推薦內容
TCGA數據庫挖掘文章套路生信視頻教程
中藥復方網絡藥理學文章套路生信視頻教程