[db:作者] - 2020-04-17
受疫情影響,上周舉行的美國植物表型會議Phenome 2020并沒有來自中國大陸的代表。Phenome會議歷來是國際植物表型圈最棒的會議之一,為了更好的與國內植物表型圈同仁分享會議進展,我們邀請到幾位海外華人代表談一下他們的參會感想。今天來分享的是唐納德丹福斯植物科學中心的李茂博士。
返程的飛機起飛了,剛參加完在美國圖桑舉辦的Phenome2020會議。由于這次的特殊情況,國內的學者們都不得不取消行程。每每看到零零散散空著的海報架,都提醒著不能與大家在此相聚的遺憾。其實專門針對植物表型的會議真的是屈指可數(shù),更為遺憾的是明年將不會有Phenome2021了。
說完遺憾,再來談談這次會議的收獲吧。最大的收獲當然依舊是約見老朋友,結識新朋友,了解最新動態(tài),建立合作伙伴。我是個半路出家的植物表型工作者,有數(shù)學背景但沒有生物方面的專業(yè)訓練,一路上都是和大家合作著,一邊學習一邊摸索著前進,所以對于大的格局和大的前景發(fā)展,還是交給專家來發(fā)表感想。在這里我就只對幾個我覺得有意思的課題談談想法吧。
我的工作主要集中在研發(fā)方法、模型和算法,從數(shù)據/圖像中量化植物表型。我是一個數(shù)據癡,總是熱衷于從數(shù)據中弄出點花樣來,所以我會特別關注有什么新的數(shù)據分析的方法或者有什么性狀需要新方法去刻畫。而和我的工作直接相關的前一步是圖像獲取,對此我也會多留意。比如各種新設備會出來怎么樣的圖像,這些圖像有著什么不一樣的特性,利用這些特點怎樣提取出更多或者不一樣的有用的信息出來。
對于設備,大家正向著更自動化、更高通量化、更輕便、更便宜的方向努力,也有非常多的巧思,裝了各種各樣的傳感器,天上飛的、地里鉆的、走溫室的、跑大田的,品種繁多我就不詳細介紹了。相信這些技術一定會像智能手機一樣以迅雷不及掩耳的速度發(fā)展。而我個人認為現(xiàn)階段產生數(shù)據的能力和速度遠超過精度處理和分析數(shù)據的能力,所以我希望自己能在這方面可以做一點努力和小小貢獻。
數(shù)據上雖然沒有新的類型出現(xiàn),但仍是五花八門并且朝著高質量發(fā)展,比如二維RGB彩圖、高光譜圖、多光譜圖、熒光成像、熱感圖等,另外還有各種三維重建技術。由于我近期主要做的數(shù)據是X射線的三維灰度圖,所以就三維數(shù)據多談幾句。三維X射線圖是高精度并且包含內部材料的數(shù)據,所以有更多可以發(fā)揮的空間,比如非破壞地提取各種結構然后分析它們之間的表型關系;更多的信息量使得更能提取出準確的拓撲結構,特別適合研究植物器官的連續(xù)生長變化。
本次會議上,來自佛羅里達國際大學的Camilo Valdes報告了用三維X射線非破壞地提取介質中的根系用于表型研究。目前該技術不完美的地方是還不能應用到大田。好消息是有課題組正在往這方面努力,比如佛羅里達大學Alina Zare報告的Backscatter X-ray設備利用反射可以非破環(huán)的提取到大田里根系的圖像,雖然目前精度還比較低,但是很有前景。丹佛斯植物科學中心Chris Topp實驗室有一個設備很值得一提,就是X-ray microscope 三維圖,該數(shù)據是可以精度到細胞級別,但是目前掃描時間特別長,達不到通量。
圖片來源:Chris Topp實驗室,未發(fā)表
這里再簡單地列舉幾個在大會報告中提到的三維數(shù)據:
新西蘭皇家研究院林業(yè)研究所Heidi Dungey報告了利用UAV+Lidar和手持Lidar設備獲取的三維點云,并應用到森林及樹的表型。我知道,這方面的數(shù)據已經大量的出現(xiàn)在農業(yè)遙感領域。
圖片來源https://www.researchgate.net/publication/304864832_The_use_of_LiDAR_for_Phenotyping
伊利諾伊大學Ursula Ruiz-Vera報告的探地雷達利用電磁波探測并進行低精度的三維重建并應用于研究木薯根的生長。雖然數(shù)據的精度相對低一些,但是非破環(huán)性的特點可以廣泛用在大田中。
賓夕法尼亞州立大學Kathleen Brown報告的激光燒蝕層析成像(Laser Ablation Tomography)利用快速切片拍照重建三維模型,研究根系的解剖性狀。雖然破壞了材料,但是出來的數(shù)據是高精度的。
圖片來源Strock et al. (2019) Laser ablation tomography for visualization of root colonization by edaphic organisms.JXB 70(19):5327-5342
另外明尼蘇達大學Bonita VanHeel 報告了關于Micro CT 的一些工作。
對于圖像處理和識別,談的最多的無疑還是深度學習尤其是神經網絡的應用。眾所周知的難點,就是需要大量的訓練樣本。我個人覺得有兩個報告里提到的方法還是很有意思的。一個是加拿大薩省大學Blanche Leyeza報告的關于從植株覆蓋的圖片中提取單植株。為了增加訓練樣本,將已經提取的單植株大量隨機合成出各種植株覆蓋的圖作為訓練,簡單來說是利用P圖技術為科研作貢獻。另一個是Alina Zare報告的Multiple Instance Adaptive Cosine Estimator方法, 大致的想法是圖形分成小的區(qū)域,每個區(qū)域標定是否有目標像素,再進行一系列的算法,相比神經網絡等深度學習,人為標注的工作量大大減小。
此外圖像處理的另外一個普遍的難點是如何從條狀物(例如根系,藤類,枝干等)的三維點云中構建出具有正確拓撲的骨架。相信這個問題的解決將會全面推進相關表型幾何及拓撲量化的精度。之后就可以考慮采用我報告中常提到的拓撲數(shù)據分析方法去量化比較啦。最后建模這塊還沒有多談,要不留著以后有機會再說。
飛機就要降落了,還有很多精彩的報告不能一一介紹, 期待在之后的各個植物表型會議上有機會和大家相聚,一起分享各種有趣的想法和研究。
李茂, 博士,唐納德丹福斯植物科學中心高級研究科學家、獨立PI。
李茂博士在廈門大學獲得數(shù)學專業(yè)本科學位,復旦大學獲得數(shù)學專業(yè)碩士學位,佛羅里達州立大學獲得生物數(shù)學專業(yè)碩士及博士學位。畢業(yè)后加入唐納德丹福斯植物科學中心Chris Topp實驗室做了和植物表型相關(例如葉片形狀,根系表型,花穗表型等)的博士后工作。目前是中心的一位PI,并在數(shù)據科學設施任職高級研究科學家。
擴展閱讀:
我的好幫手
投訴建議:0571-87291296