機器視覺概念范文

時間:2023-12-28 17:40:16

導語:如何才能寫好一篇機器視覺概念,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

機器視覺概念

篇1

關(guān)鍵詞:視覺性;圖畫性;李格爾;澤德爾邁爾;潘諾夫斯基;維也納藝術(shù)史學派

作者簡介:王艷華,女,廣西民族大學外國語學院教師,從事西方藝術(shù)史及藝術(shù)理論研究。

中圖分類號:I01 文獻標識碼:A 文章編號:1000-7504(2017)03-0127-08

1994年,W. J. T. 米歇和博姆繼羅蒂“語言學轉(zhuǎn)向”之后分別提出了“圖像轉(zhuǎn)向”(the pictorial turn or the iconic turn),后來又被“更加廣泛地概括為‘視覺轉(zhuǎn)向’(the visual turn)”[1](P11)。此后國內(nèi)學界迅速做出回應,如今我們的視覺文化研究已有近二十年歷史。然而,視覺性作為核心概念之一,對它的意義和起源的闡釋仍不夠透辟,反之,這也在某種程度上限制了我們對視覺文化研究的進一步開掘。正如迪克維斯特卡亞在《文化轉(zhuǎn)向之后的視覺研究》中所言,對于視覺研究的范圍、對象、定義及方法等完全沒有達成共識。[2](P2)在國內(nèi)吳瓊也提出類似的觀點,“對于其(視覺文化――引者注)基本的理論問題和方法論,人們的認識尚有諸多曖昧不明之處”[3]。所以,他建議根據(jù)三個譜系學源頭去梳理學科的發(fā)生史及基本范疇和方法,即批判的現(xiàn)代性/后現(xiàn)代性話語、圖像學與藝術(shù)史研究以及“文化研究”。在吳瓊看來,以上三種學術(shù)話語以其不同的背景和原因,在演進過程中互相影響,互相滲透,最終在視覺文化研究這一思潮里形成交叉與匯流。[3]可是,事實上,三種理論話語所形成的復調(diào)式理論建構(gòu),恰使人們對視覺文化的理論與方法論認識“曖昧不明”,成為諸多概念模糊不清的主要原因。而三者對該“學科交叉地帶”的進一步爭奪,又使概念的溯源和界定,使學科譜系、理論、方法論的一些相關(guān)問題變得更為復雜。下面,我們就視覺性一詞來舉例,說明視覺文化研究概念界定不清的問題,進一步溯源其概念,并思考解決概念界定不清的路徑。

一、關(guān)于概念界定的“懸而未決”

尋根溯源,在視覺文化領(lǐng)域,一般認為,1988年哈爾?福斯特(Hal Foster)和諾曼?布列遜(Norman Bryson)最早提出這一概念。通過對比視覺和視覺性兩個概念,福斯特提出“視覺暗指所見景象為物理運作,視覺性暗指其為社會事實”[4](序言,P28)??梢?,在視覺文化領(lǐng)域,從視覺性這一概念初被提及開始,它就天然地衍生于文化研究這一學科,“社會事實”所指向的是各種社會活動,文化研究無所不包的研究對象統(tǒng)統(tǒng)被統(tǒng)籌于視覺性這一范疇中來。他進一步解釋到,為了實現(xiàn)一種觀看目的,即“在所見景象機制及其歷史手法之間,在視覺資料及其話語決定機制之間――我們?nèi)绾慰创挛?,我們?nèi)绾斡心芰?、被允許、被促成去看待事物,我們?yōu)楹慰吹酱宋锒鲆暠宋铩R曈X體制試圖憑借各自的修辭與表征,將社會的種種視覺性打造成本質(zhì)為視覺的東西,或?qū)⑵湓谝粋€可見的自然等級中進行排序”[4](序言,P28)。這里,視覺性成為人們試圖發(fā)掘的作為視覺觀看的“本質(zhì)”或“本體”的東西,它可以包括“所見景象機制”和“視覺資料”,但并不包括創(chuàng)造視覺對象和景觀的“歷史手法”和“話語”機制,以及“如何看待事物”的方式、方法,而后者,在藝術(shù)史上費德勒提出視覺性范疇之后,原本是視覺性更廣泛意義的最主要部分,視覺性在藝術(shù)史上的動態(tài)特征和靜態(tài)特征發(fā)展到視覺文化時從一開始就陷入僵化、固化的境地,惠特尼批判它被完全“實體化”,只留下靜態(tài)特征作為考察對象。雖然它的“象征價值”經(jīng)由圖像學得到一步步擴展、完善,然而“形式價值”卻已被遺忘,作為動態(tài)的方法論意義更是無人提及。

事實上,當福斯特試圖在視覺和視覺性比較中對后者進行界定,強調(diào)“擺脫模糊失焦的疊加,打破既定視覺事實排序”[4](序言,P28)的重要性,側(cè)重對影響“觀看”的諸多歷史文化因素的強調(diào)時,如果將視覺性視為“自然”進一步社會化的產(chǎn)物,那么,這在先前的藝術(shù)史學科中早有討論,19世紀末至20世紀上半葉維也納藝術(shù)史學派的社會歷史方法早已經(jīng)為我們提供了借鑒。所以,福斯特的定義并無新意,它只是延續(xù)了文化研究的研究方法,并沒有提出具有獨創(chuàng)意義的視覺文化的視覺性概念,而且,對于藝術(shù)史的視覺性也沒有構(gòu)成合理的互文性,福斯特對于視覺性的界定,僅是從文化研究的角度去進行闡釋。

二十年來,試圖對視覺性這一單一概念進行定義和闡釋的討論并不多見。另一個典型例證可見于2006年,米爾佐夫借鑒韋登斯堡、里德、卡萊爾、愛默生等人的理論,表達了自己對視覺文化意義上的視覺性的理解:

視覺性對于英雄碰巧是可以獲得的清晰的歷史圖畫,歷史學家在回顧中可獲得同樣的圖畫。但對于僅僅觀察事件而不形成視覺性的普通人來說,它是不可見的。[5](P57)

相對于福斯特所下的定義,這一闡釋顯然更為抽象,更為模糊不確定,然而它卻暗示了視覺性一詞所具有的圖像學特征及源脈關(guān)系。另一位對視覺文化給予著名定義的W.J.T.米歇爾也是一位批判的圖像學家。他們的論述可看出對藝術(shù)史和圖像學的溯源性研究,這一進展振奮人心,它為嫁接藝術(shù)史和視覺文化二學科,彌合二者長期以來的斷裂或久未實現(xiàn)的關(guān)聯(lián)性,為克服種種視覺文化研究的學術(shù)困境做出了很大努力,顯著地推進了研究進展。然而,在視覺文化內(nèi)部,緊接著則有很多學者試圖大刀闊斧地進行學科化革新,他們試圖建構(gòu)新的理論語境以及全然獨立的視覺文化這一學科,他們又轉(zhuǎn)向文化研究去尋求突破口,強調(diào)視覺性恰是使得事物從不可見成為可見的必要條件。在國內(nèi)這一理論最強有力的代表是吳瓊,他發(fā)展了米爾佐夫的視覺性指向事物的“不可見性”這一觀點,提出視覺性是“從不可見轉(zhuǎn)為可見的運作的總體性”[6],所以,此后,我們認為視覺性仍向“文化研究”這一理論維度發(fā)展。

進一步而言,在國內(nèi),使問題變得更為復雜的是在不同理論背景中甚至回至前科學階段去溯源概念的過程。比如,2011年,劉晉晉在《何謂視覺性?――視覺文化核心術(shù)語的前世今生》一文中提出,視覺性最早可追溯到韋登斯堡神秘主義的視覺性概念,據(jù)此,劉晉晉試圖在現(xiàn)代性/后現(xiàn)代性話語體制下,進一步擴大視覺性的適用范圍。不僅如此,他還對上述諸種定義皆進行了批判。首先,針對吳瓊的觀點:“‘視覺性’不是指物的形象或可見性,而是海德格爾意義上的‘世界的圖像化’,是使物從不可見轉(zhuǎn)為可見的運作的總體性,這種總體性既包括看與被看的結(jié)構(gòu)關(guān)系,也包括生產(chǎn)看的主體的機器、體制、話語、比喻之間復雜的相互作用,還包括構(gòu)成看與被看的結(jié)構(gòu)場景的視覺場?!盵6]劉晉晉認為,“‘運作的總體性’太空泛從而缺乏使用效力。列舉‘這種總體性’顯然不是在闡釋術(shù)語內(nèi)涵而是在羅列外延?!诰唧w對象面前‘視覺性’似乎成了多余”[7]。其次,劉晉晉雖然試圖對米爾佐夫論述的視覺性加以概括:(1)觀看(view),(2)一連串景象、全景(panorama),(3)強調(diào)杜波伊斯的“顛倒的視覺性”,然而,他認為米爾佐夫試圖抬高視覺化(“視覺的文化化”)以抵制視覺文化的真正核心――“視覺性”。而且,他還認為,米爾佐夫2006年《關(guān)于視覺性》一文中對托馬斯?卡萊爾新造該詞的歷史溯源這一過程“考證并不確切”,“是對‘視覺性’原義的歪曲”,他認為,“米爾佐夫的概念引入是對卡萊爾視覺概念的簡單偷梁換柱”。[7]

使研究變得更加復雜化的是,曾軍等表示直接將視覺性剔除而以“視覺化”取而代之。曾軍將對“視覺”的理解分為名詞化和動詞化兩種,并認為,“作為一種整合的努力”,視覺性“由于其界定的曖昧”而無法承擔對視覺的表征。曾軍認為,理解視覺的基礎(chǔ)是視覺生物學,或者是傳統(tǒng)視覺藝術(shù)門類之間的區(qū)分。在他看來,如果只將視覺視為自然的賜予,則不能表征“我看事物、看世界的方式都被徹底文化化”這一事實。他的偏見在于,他認為對于直觀形象性的圖像表征僅是“一種技術(shù)性、藝術(shù)史的活動,是一種僅僅通過訓練即可達成的技巧”。因此,“視覺性”應該被“視覺化”這一概念所取代。[8]事實上,曾軍的批判恰為我們提供了進一步理解視覺性的依據(jù),并不是宣布對它的摒棄而徹底轉(zhuǎn)向“視覺化”。盡管如此,我們在視覺性概念溯源這一問題尚未解決之前,暫不討論視覺性概念是否該被消滅的問題。

所以,導致視覺文化的視覺性概念不清的原因有以下兩點。一方面,自視覺文化發(fā)端時起,受批判的現(xiàn)代性/后現(xiàn)代性話語以及“文化研究”的影響,在國內(nèi)關(guān)于視覺性的闡釋方面顯出與藝術(shù)史概念的斷裂和混淆不清,或者即使有的學者找到與藝術(shù)史的聯(lián)系卻未被后來學者理解或正確闡釋(比如劉晉晉對米爾佐夫思想的錯誤性批判等),導致后來學者進一步討論視覺文化各種相關(guān)概念性命題時經(jīng)常陷入至少上述三種不同學術(shù)語境之一種,無法獲得概念在這些不同學科之間的聯(lián)系性,這使視覺文化研究面臨對話艱難、自說自話以及泛文化的尷尬局面。另一方面,根據(jù)迪克維斯特卡亞的觀念,20世紀80年代中后期開始,藝術(shù)史與文化研究理論碰撞和交互沖突之下,產(chǎn)生視覺文化這一新興領(lǐng)域。從此,視覺以及視覺性就成了兩個學科都十分關(guān)注的核心術(shù)語,人們分別從不同路徑對其進行探索。一直以來,我們的研究更多地側(cè)重于二者之間的差異性,視覺文化的視覺性是在文化轉(zhuǎn)向潮流之中、在廣泛的文化化論證階段被討論,而且主要著重于對藝術(shù)史視覺性、生理視覺性(知覺)、物理視覺性等種種否定或超越,強調(diào)其文化包容傾向,強調(diào)其歷史、社會、政治的“象征價值”;換言之,視覺文化的視覺性還沒有進入理性論證階段,對于這一范疇的討論因此尚處于探索階段且略顯混亂。因此,對于該詞給予一次溯源性思考仍然是必要的,而且,值得補充的是,對于范疇的討論本身并非陷入本質(zhì)主義的桎梏。

二、“視覺性”概念溯源:從視覺理論進入視覺文化

關(guān)于視覺文化和藝術(shù)史的關(guān)系,迪克維斯特卡亞總結(jié)出三種不同的觀點:

第一種認為視覺文化研究是藝術(shù)史的一種合理延伸;第二種則認為,作為獨立于藝術(shù)史的一個新聚焦點,它(視覺文化)更適合于采用與數(shù)字化、虛擬化時代相關(guān)的視覺技術(shù)來進行研究;最后一種觀點認為,視覺文化研究是對傳統(tǒng)藝術(shù)史學科的威脅和自覺的挑戰(zhàn)。[2](P3)

不論視覺文化對藝術(shù)史是“合理延伸”還是“威脅和自覺的挑戰(zhàn)”,這里,我們都試圖堅持最原始的譜系學思維,先去找到兩個學科之間的淵源關(guān)系,再在后續(xù)研究中進一步論證二者是否獨立、互不關(guān)涉還是“合理延伸”或彼此“斗爭”。下面,我們以視覺性這一概念為例來溯源視覺文化的藝術(shù)史淵源。

視覺文化中的視覺性概念,應以藝術(shù)史上視覺理論的發(fā)端作為源頭。當我們回顧視覺的歷史,回溯到視覺理論得以創(chuàng)建、現(xiàn)代藝術(shù)史或藝術(shù)科學(形式學說階段)的確立這一時期時,我們會找到可資借鑒的學科源頭和范疇參照,有助于弄清視覺性概念的來龍去脈。我們認為:視覺性經(jīng)歷了藝術(shù)史研究對象的進一步擴展,藝術(shù)史形式研究與圖像研究的方法論轉(zhuǎn)換,逐漸走向社會歷史文化等多元理論與方法,并在批評理論作為闡釋工具的介入之下,逐漸融入文化研究潮流,成為視覺文化中的重要范疇??傮w而言,視覺性經(jīng)歷了藝術(shù)史、圖像學以及視覺文化三個時期:首先,在藝術(shù)史上,李格爾等形式主義學者提出視覺理論,確立藝術(shù)科學作為一種新興學科,賦予了視覺性以“形式價值”和“象征價值”,并主要通過“形式價值”對它進行界定;其次,潘諾夫斯基創(chuàng)立圖像學,重新確立“象征價值”高于“形式價值”的標準,強調(diào)視覺性的“世界圖畫”的文化表征功能;然而,后來的視覺文化研究雖然發(fā)展了潘氏對于“象征價值”和“世界圖畫”的觀念,視覺性的藝術(shù)史源脈卻被切斷或未被發(fā)掘,視覺性概念被實體化,它的方法論功能以及“形式價值”被忽視。

回顧視覺的歷史,首先,康拉德?費德勒提出純視覺性,一般被認為開創(chuàng)了視覺理論之先河。[9](P114)費德勒認為藝術(shù)獨立于美學與藝術(shù)哲學,反對黑格爾主義美學基于抽象沉思的唯心主義觀念,他強調(diào)知覺體驗,提出純視覺性:

藝術(shù)家被驅(qū)使去培養(yǎng)自己的視覺觀念……假如我們有能力達到遵循這種創(chuàng)造力的程度,我們通過運用藝術(shù)家的想象力,可以使得關(guān)于世界的視覺觀念在構(gòu)成形式方面日趨豐富。[10](P3)

在這場視覺理論轉(zhuǎn)向中,費德勒不僅反對一切哲學形而上學論,而且全心投入到“視覺形式創(chuàng)造機制的分析中”,全面展開“對藝術(shù)家視覺形式創(chuàng)造過程的研究”,從而使“先前多少有些客體化了的形式關(guān)系與其內(nèi)在精神目標在純視覺理論中獲得協(xié)調(diào)”。[11](P26)

所以,在藝術(shù)史以及相關(guān)學科(例如視覺文化)研究中,在黑格爾的“心靈”和唯心主義觀念之外,視覺性開始被視為形式表征,其“形式價值”開始得以強調(diào),其中最為典型的是李格爾、沃爾夫林、澤德爾邁爾等提出的形式理論,或者毋寧說,視覺理論?!瓣P(guān)于(李格爾、沃爾夫林等)德語國家早期藝術(shù)史研究的文論,人們通常給予的假定是,它基于簡單、狹隘的形式主義”[12](P1),李格爾、沃爾夫林以及澤德爾邁爾等維也納二代學者也由此被稱為形式主義者?!笆聦嵣?,他們的主要學術(shù)貢獻并非在于形式研究,而是開創(chuàng)了視覺理論,并使之成為藝術(shù)科學的理論基礎(chǔ),由此顛覆了藝術(shù)史傳統(tǒng)?!盵13](P45)

李格爾在《羅馬晚期的工藝美術(shù)》里根據(jù)一個概念“藝術(shù)意志”、兩個范疇“觸覺的”和“視覺的”所建構(gòu)的理論體系中,使“觸覺的”和“視覺的”一對范疇脫離了原本的知覺含義,成為形式表征[14],突顯其“形式價值”。比如,李格爾認為,古代早期“觸覺式”建筑設(shè)計的藝術(shù)意圖,“只要可能就會熱衷于構(gòu)造空間的邊界,壓制并掩藏起另一任務,即空間的創(chuàng)造”;對于羅馬晚期“視覺式”風格取向的建筑而言,比如萬神廟,“同一個面上不存在兩個點,因此建筑的所有部分就必須有一個統(tǒng)一的大輪廓”[15](P17),這一“大輪廓”實際上指向的是“空間的創(chuàng)造”,所以,“觸覺式”風格趨于對平面的追求,“視覺式”風格趨于對“空間的創(chuàng)造”的形式要求。而且,“在建筑領(lǐng)域……‘觸覺式’是通過一系列藝術(shù)意圖的取向(藝術(shù)形式――引者注)來獲得的,比如強調(diào)平面維度、構(gòu)造體塊布局、依靠立柱來隔斷空間、回避色彩或濃重的陰影對單一平面感的破壞等等?!曈X式’反之,就存在于逐步建的‘統(tǒng)一的大輪廓’、追求深度的不斷變化以‘引向縱深’、自由空間的個體化、創(chuàng)造多個色彩生動的平面或加強陰影以打破單一平面等等(形式――引者注)”[14]??梢姡罡駹柕刃问街髁x者主張從形式表征的角度去考察視覺性這一范疇,雖然當時李格爾還沒有明確提出“視覺性”這一術(shù)語,而是以“視覺的”或“視覺式”(opisch)來對其進行表征,但是,二者含義相似,事實上,李格爾對于視覺性的“形式價值”的強調(diào)是毋庸置疑的。

進一步而言,我們可以將李格爾的視覺性做如下總結(jié)。其一,視覺性是一種“藝術(shù)意志”(“自由的、創(chuàng)造性的藝術(shù)沖動”[16](P29));是一種創(chuàng)造力,亦即一種方法論,是創(chuàng)造或構(gòu)造形式的方法。其二,是物化的客體特征,與“觸覺的”/“圖畫的”構(gòu)成統(tǒng)一,相互融合,又彼此斗爭。其三,不具有實體性。其四,是視覺理論的核心概念,但是沒有明確界定。另外,根據(jù)李格爾對不同時代具體的“藝術(shù)意志”的闡釋以及沃爾夫林所強調(diào)的視覺性所指向的“時代精神”來看,視覺性在形式主義者那里包含了“視覺體驗的象征形式”這一現(xiàn)代視覺性內(nèi)涵??梢?,雖然視覺性是作為形式學說術(shù)語被提出,并作為形式研究方法進入藝術(shù)史,但事實上,上述學者是最早的一批視覺理論家,他們的主要貢獻是創(chuàng)建并完善視覺理論并以視覺理論顛覆傳統(tǒng)形式理論,他們運用視覺性反叛或替代形式/風格甚至“圖像”等范疇,深入研究形式。所以說,視覺性一經(jīng)提出,就具有形式這一自然屬性,成為新的形式(表征),同時,它又是一種新的方法論原則,用以重新闡釋形式/風格,它自身具有相對獨立性,從此種意義上來講,它甚至成為“反形式”,對立于形式、風格以及圖像,其“象征價值”逐漸凸顯。不過,形式學說時期,藝術(shù)史家們對視覺性的“象征價值”的闡釋不足,這一點后來在潘諾夫斯基的圖像學研究中得到了補充。

此外,藝術(shù)史上形式學說之后的視覺理論家或藝術(shù)史家,仍然在不斷推進對這一范疇的研究,就視覺性與形式的關(guān)系而言,眾家紛說不一。比如,除下文我們主要討論的潘諾夫斯基之外,貢布里希側(cè)重于藝術(shù)心理學研究,他認為人類是沒有純真之眼的,視覺性作為“觀看”的過程絕不是一個被動的過程,而是對大自然所提出的某一個問題的結(jié)果,是“匹配的藝術(shù)圖式”[17](P29);魯?shù)婪?阿恩海姆認為,視覺是“選擇性思維”[17](P26),這是從知覺心理學角度去研究視覺性和視覺思維。中國學者王耀中曾總結(jié)過形式的視覺化過程,比如視覺通過對跳躍性、無限性、無序性的形式進行重新定位和組織、選取,使其定格化、截取化、組織化,以實現(xiàn)審美視覺效果。[18]

總之,視覺性是視覺理論的核心概念,是在形式理論發(fā)展進程中出現(xiàn)的,它對立于形式/風格/圖畫性或圖像,并在形式學說那里,試圖在客體形式與主體精神的統(tǒng)一原則中實現(xiàn)它的文化象征意義。但是,在這一時期,視覺性與圖畫性之間的對立性,以及它所具備的“象征價值”尚未得以強調(diào)。然而,通過以上探討,我們認為,作為視覺理論家而非形式理論家的“藝術(shù)史之父”們,他們針對視覺性范疇所展開的闡釋對后來與“文化研究”以及現(xiàn)代性思潮具有承繼關(guān)系的視覺文化研究理論及范式有著整體性開創(chuàng)和促進作用。

三、概念衍變:潘諾夫斯基及其圖像學擔當中介

如前所述,在形式學說時期視覺性的“象征價值”沒有得到全面的闡發(fā)。潘諾夫斯基試圖補足這一點。潘氏強調(diào),視覺性是“思想的構(gòu)像習慣”,是體驗形成中象征行為的建構(gòu)性特征,是視覺體驗的象征形式。[19]具體來說,指我們看、構(gòu)像和構(gòu)畫的體驗。潘諾夫斯基通過對丟勒作品的分析研究,試圖打破形式學說的形式統(tǒng)一,去尋找“可稱為內(nèi)容逐漸顯示的過程”,論證作品如何實現(xiàn)形式、動機與敘事主題內(nèi)容的不可分割的統(tǒng)一,并借此界定“偉大的象征形式”。[19]這一過程體現(xiàn)了圖畫性讓渡于視覺性,以及圖畫性受制于或由視覺性決定。換言之,潘氏試圖打破形式統(tǒng)一于圖畫性和視覺性這一局面,由此,恰走向了視覺文化中視覺性的關(guān)鍵一環(huán):非圖畫性/視覺性二者之間的統(tǒng)一性而是斗爭性或?qū)α⑿允挂曈X性的地位得以提高,使視覺性具有更大闡釋和可發(fā)掘的空間。所以,對于潘氏而言,視覺性所構(gòu)造的圖像是“圖畫之外”,是作為“被圖繪的”特殊世界之外的認識,是超越于媒介的觀看之外的觀看,如此,我們才能進一步理解視覺性投射又預設(shè)一種作為“觀看方式”的世界圖畫或世界認識。對于潘氏而言:其一,“象征價值”是深層文化累疊的根源,可凝聚并呈現(xiàn)多元文化意義,同時,文化意義又會帶來“看”的行為差異,所以,看就成為了“觀看”(viewing);其二,人看到的“世界圖像”是圖畫之外(extra-pictorial)的世界認識,不是圖畫本身,相反,是對被圖繪的特殊世界的超越或否定;其三,視覺性構(gòu)成“世界圖畫”,傳達文化總體的視覺性特征??梢?,這些特征都是將視覺性從形式學說向視覺文化進一步推進的必由之路。

另外,通過對比形式學說和圖像學的理論和方法論,我們能夠發(fā)現(xiàn),視覺性不是一個歷史對象,而是歷史方法的分析極。正如惠特尼所說,“視覺性既投射又預設(shè)一種作為‘觀看方式’的世界圖畫或世界認識,其中包括觀看圖畫的方式。這種投射―預設(shè)有一段特別的歷史,正是我們要追溯的。這里,我們必須注意到一種方法論的循環(huán)。視覺性不是純粹的觀看,視覺性必須以圖畫構(gòu)造活動為媒介,而圖畫構(gòu)造活動并不能完全化約為構(gòu)成它的視覺性。就這個意義而言,視覺性不是一個歷史對象,而是歷史方法的分析極,以之可以處理實際的歷史對象:既投射又預設(shè)圖畫的人類視覺”[19]。

這里,對照而言,圖像學對于形式學說的改造體現(xiàn)在方法論方面:形式學說試圖通過對形式語言進行“文本細讀”的方式來把握對世界的整體認識,即視覺性,而圖像學通過對形式的超越去把握世界的“觀看”。值得指出的是,二者在方法上雖然有別,但是無論圖像學還是形式學說,它們的方法論是交叉進行的,也就是說,是以方法論循環(huán)往復的形式分別展開各自的研究。其中,圖畫性和視覺性同時可以被視為方法論的兩極,無疑,這一主張是“藝術(shù)史之父”們――李格爾以及沃爾夫林等開創(chuàng)的。潘諾夫斯基和澤德爾邁爾等將其分別引向了不同的研究方向:潘氏在“象征價值”基礎(chǔ)之上展開形式研究;澤氏在“形式價值”基礎(chǔ)之上展開象征研究,這兩種理論最終都將客體世界深層的社會、文化、歷史意義揭示出來,交匯于關(guān)于“世界圖景”的領(lǐng)悟和闡釋一極。

至此,藝術(shù)史上這種理論文脈的糾結(jié),在方法論循環(huán)上得到了厘清,同時,視覺性作為一種方法論的身份,也在圖像學以及藝術(shù)史領(lǐng)域得到廣泛的認同。然而,在視覺文化領(lǐng)域,這種身份卻未被發(fā)掘。在惠特尼看來,“如今,視覺文化研究常常將一種純粹的視覺性實體化。確實,視覺性似乎常常被當作一個歷史對象,即所謂的‘視覺文化’。但是,這種做法違背了文化意義的原發(fā)性現(xiàn)象累疊這一前提,而原發(fā)性現(xiàn)象累疊據(jù)推定最終等同于視覺感知的原發(fā)性本體累疊。當視覺文化研究把視覺性當作圖畫構(gòu)造史的真正基礎(chǔ),而不是圖畫構(gòu)造史的一個時刻,它就不能以融貫的方式將圖像自身的效果――圖像按理應該具備的對視覺的構(gòu)造性排序――與視覺中圖畫載體的各種原因聯(lián)系起來,也就是說,它就只能將效果和原因混為一談。實體化的純粹視覺性只是視覺的‘世界觀’或‘時代之眼’的另一個令人質(zhì)疑的教條”[19]。

舉例來講,比如曾軍在批判視覺性概念時,他說:“視覺文化研究已不僅僅是傳統(tǒng)意義上的視覺藝術(shù)的研究,而是廣泛滲透到了當代文化、日常生活和社會現(xiàn)實之中,甚至過去當仁不讓作為視覺藝術(shù)典范的造型藝術(shù)(繪畫、雕塑等)已在視覺文化研究對象中居于邊緣,基于視覺媒介技術(shù)而興起的電影、電視、網(wǎng)絡(luò)等則占據(jù)了中心。另一方面,從研究方法上講,對視覺現(xiàn)象形式及其意味的審美分析早已不再是視覺文化關(guān)心的論題,視覺與權(quán)力、視覺與性別、視覺與商品廣告、景觀社會、擬象、仿真、城市視覺文化、旅游者的凝視、風景與帝國等,已將視覺置于社會與文化的語境進行考察,所展開的已是詹克斯所說的‘視覺性社會理論’(social theory of visuality)了。”[8]這里,曾軍所詮釋的視覺性存在概念混淆問題。他幾乎將視覺性狹隘化地指涉為“圖畫性”,將視覺性的形式屬性或圖像功能作為批判的重點,只是片面地強調(diào)了視覺性的表征功能和“象征價值”。套用曾軍自己的話,“為什么會這樣?”原因在于他將著眼點放在“實體化的視覺性”上面,而且,泛文化研究傾向使他陷入兩難的境地,即使他意識到視覺的動態(tài)特征,他卻不愿意將這種視覺性闡釋開來,即使他提到科比特所強調(diào)的“‘視覺性’意味著視覺不是一個單純的分類,而是一個正在形成中的文化和歷史”[8],他卻沒有將視覺性在這種動態(tài)“形成”中所擔負的方法論意義展開。在這種概念不清的情況下,將視覺性直接拋棄并以視覺化取而代之的做法,是不太恰當?shù)摹?/p>

另外,吳瓊曾試圖論述視覺文化的視覺性,在他看來,視覺性問題是“對現(xiàn)代世界的主體建構(gòu)、文化表征的運作以及視覺實踐之間的關(guān)系進行分析,揭示了人類文化行為尤其是視覺文化中看與被看的辯證法,揭示了這一辯證法與現(xiàn)代主體的種種身份認同之間的糾葛”[6]。以上可見,這種辯證法體現(xiàn)了“象征價值”,但是,他在試圖建構(gòu)“世界圖畫”過程中卻將其推向了實體化的層面。當然,很多學者也注意到海德格爾所強調(diào)的“世界的圖像化”,可是,當我們將其視為從“不可見轉(zhuǎn)為可見的運作的總體性”時,我們試圖將視覺性泛文化的傾向就十分明顯,很多學者盡可能大而駁雜地賦予視覺性無限寬廣的內(nèi)涵及外延,比如“這種總體性包括看與被看的結(jié)構(gòu)關(guān)系,也包括生產(chǎn)看的主體的機器、體制、話語、比喻之間復雜的相互作用,還包括構(gòu)成看與被看的結(jié)構(gòu)場景的視覺場,總之,一切使看/被看得以可能的條件都應包含在這一總體性之內(nèi)”[6]。這種泛文化傾向忽視了以方法論的方式去實踐這每一環(huán)節(jié),以至于“文化化”的視覺性陷入了扼殺視覺性自身的陷阱。

簡而言之,視覺性一經(jīng)藝術(shù)科學時期的藝術(shù)史家們提出,就先天地具有了“象征價值”,與圖畫性所表征的“形式價值”相互轉(zhuǎn)化,也相互分離。視覺性是一種方法論,與圖畫性或“形式”互為補充,構(gòu)成沖突,形成方法論的循環(huán),使藝術(shù)史研究富于生機?!斑@種根本的分離造成分裂狀況,由此激發(fā)視覺想象和圖畫構(gòu)造,形成從形式到象征,從圖像到‘話語’,從感知到理智,或者反向循環(huán)的真正機制?!盵19](P31)圖像學對視覺性“象征價值”及其文化表征的發(fā)掘嫁接了視覺理論與視覺文化兩個領(lǐng)域。視覺文化的視覺性對于藝術(shù)史的視覺性是一個合法的繼承。如果對這種繼承關(guān)系發(fā)掘得不夠深入,帶來的混亂將危及整個視覺文化研究進程和學科體制的進一步建制。事實上,藝術(shù)史可為視覺文化提供方法論循h(huán)功能方面的借鑒;正如肖偉勝所言,藝術(shù)史“憑借其理論資源和方法論上的多元和開放性,奠定了一門新的學科,對視覺研究產(chǎn)生了極其重要的影響”[20]。對視覺性等基礎(chǔ)概念的藝術(shù)史溯源,或可形成應對當下的視覺象征危機的一個重要方面。

參 考 文 獻

[1] 周憲:《視覺文化讀本》,南京:南京大學出版社,2013.

[2] Margaret Dikovistkaya. The Study of the Visual after the Cultural Turn. New York: MIT Press,2005.

[3] 吳瓊:《視覺文化研究:譜系、對象與議題》,載《文藝理論研究》2015年第4期.

[4] Hal Foster. Vision and Visuality. Seattle:Bay Press,1988.

[5] Nicholas Mirzoeff.“On Visuality”,in Journal of Visual Culture,2006(5).

[6] 吳瓊:《視覺性與視覺文化――視覺文化研究的譜系》,載《文藝研究》2006年第1期.

[7] 劉晉晉:《何謂視覺性?――視覺文化核心術(shù)語的前世今生》,載《美術(shù)觀察》2011年第11期.

[8] 曾軍:《從“視覺”到“視覺化”:重新理解視覺文化》,載《社會科學》2009年第8期.

[9] Michael Podro. The Manifold in Perception: Theories of Art from Kant to Hildbrand. Oxford: the Clarendon Press,1972.

[10] Conrad Fielder. On Judging Works of Visual Art. translated by Schafer-Simmern, Henry and Mood Fulmer. California:University of California Press, 1957.

[11] 張堅:《視覺形式的生命》,杭州:中國美術(shù)學院出版社,2004.

[12] Mitchell Benjamin Frank, Daniel Allan Adler. German Art History and Scientific Thought: Beyond Formalism.Great Britain: MPG Books Group,2012.

[13] 王艷華:《澤德爾邁爾研究》,南京大學博士論文,2015.

[14] 王艷華:《“觸覺的”和“視覺的”二元風格范疇――李格爾藝術(shù)史論管窺》,載《東南大學學報》(哲學社會科學版)2014年第4期.

[15] 李格爾:《羅馬晚期的工藝美術(shù)》,陳平譯,北京:北京大學出版社,2010.

[16] Alois Riegl. Problems of style. Princeton:Princeton University,1992.

[17] E. H. Gombrich. Art and Illusion: A Study in the Psychology of Pictorial Representation. New York: Pantheon, 1960.

[18] 王耀中:《形式化視覺:美術(shù)實踐與思維的取向》,載《中國藝術(shù)》2010年第4期.

[19] Davis Whitney. “Visuality and Pictoriality”, in Journal of Anthropology and Aethetics,2004(fall).

[20] 肖偉勝:《視覺文化的衍生c藝術(shù)史轉(zhuǎn)向》,載《文藝研究》2011年第5期.

篇2

【關(guān)鍵詞】機器視覺;飲料行業(yè);生產(chǎn)效率

一、引言

如今產(chǎn)品質(zhì)量問題越來越受到重視,對產(chǎn)品質(zhì)量的檢測是關(guān)系人們身體健康的前提,所以要從根本出發(fā)堅決杜絕不合格產(chǎn)品流入市場。機器視覺系統(tǒng)是解決這一問題的一個有效可行的措施,其利用高尖端的科技技術(shù)對產(chǎn)品進行檢測,滿足企業(yè)對產(chǎn)品的檢測要求。本文針對實際可樂及啤酒企業(yè)生產(chǎn)線上存在的問題及要求,運用機器視覺系統(tǒng)加以分析解決,達到了良好的效果。

二、系統(tǒng)組成

機器視覺就是用機器代替人眼來做測量和判斷。其特點是提高生產(chǎn)的產(chǎn)品質(zhì)量和生產(chǎn)線自動化程度。尤其是在一些不適合于人工作業(yè)的危險工作環(huán)境或人眼難以滿足要求的場合,常用機器視覺來替代人工視覺;同時在大批量工業(yè)生產(chǎn)過程中,用人工視覺檢查產(chǎn)品質(zhì)量效率低且精度不高,用機器視覺檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。而且機器視覺易于實現(xiàn)信息集成,是實現(xiàn)計算機集成制造的基礎(chǔ)技術(shù)。

機器視覺系統(tǒng)是指通過機器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將要檢測的目標轉(zhuǎn)換成數(shù)字量信號,這些數(shù)字量信號再傳送給專用的圖像處理系統(tǒng)(分嵌入式和視頻卡方式),圖像處理系統(tǒng)根據(jù)要檢測的任務要求來設(shè)置檢測任務。然后根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。機器視覺系統(tǒng)在線質(zhì)量檢測是其最主要的應用之一,因為它是非接觸測量,測量速度快且精度高,因而可以實時在線檢測[2]。目前在飲料灌裝生產(chǎn)線上,視覺產(chǎn)品獲得了一定的應用,如娃哈哈、康師傅等。現(xiàn)今視覺產(chǎn)品分兩大類:

1.嵌入式系統(tǒng)

嵌入式系統(tǒng)將全部的視覺系統(tǒng)所需要的硬件:CCD、內(nèi)存、處理器以及通訊口壓縮在一個“黑箱”式的模塊里。優(yōu)點是性價比高,使用方便,對環(huán)境的適應性強。嵌入式系統(tǒng)的發(fā)展速度最快,是機器視覺的發(fā)展趨勢。

2.基于PC的系統(tǒng)

基于PC的系統(tǒng)是傳統(tǒng)的機器視覺系統(tǒng),硬件包括:CCD相機、視覺采集卡、PC等。目前居于市場的主導地位,但價格昂貴,對工業(yè)環(huán)境的適應性弱。

機器視覺檢測系統(tǒng)結(jié)構(gòu)圖如圖1所示。

三、檢測系統(tǒng)設(shè)計

(一)企業(yè)存在的問題及相關(guān)設(shè)計要求

如今飲料行業(yè)在生產(chǎn)線上還處在用人眼來識別產(chǎn)品的質(zhì)量問題,一般一個生產(chǎn)線上要安排3~4個人輪流檢測,這樣不但操作人員工作強度高而且質(zhì)量也存在著嚴重的隱患,隨著自動化水平的提高,生產(chǎn)線上的要求越來越苛刻,工藝越來越復雜,這種以人工來檢測的方法勢必不符合生產(chǎn)的需求,這樣就要求出現(xiàn)一種更快更準的檢測系統(tǒng),即機器視覺檢測系統(tǒng)。

1.飲料生產(chǎn)線檢測要求

(1)檢測瓶蓋的高低狀況;

(2)檢測瓶內(nèi)液位的高低;

(3)檢測瓶子的標識狀況;

(4)將不合格產(chǎn)品剔除;

(5)在觸摸屏上顯示信息;

(6)檢測速度為800瓶/分。

2.飲料瓶在線檢測要求

(1)啤酒瓶缺陷檢測(包括瓶身裂紋、瓶口破損);

(2)啤酒瓶有無異物;

(3)啤酒瓶是否混入其它類型瓶;

(4)檢測速度應達到500瓶/分。

3.灌裝生產(chǎn)線檢測要求

(1)灌裝液位檢測;

(2)異物檢測。

(二)系統(tǒng)設(shè)計分析

根據(jù)要求對系統(tǒng)進行分析,在線檢測系統(tǒng)構(gòu)成由三臺視覺相機分布成120度,這樣可以檢測到瓶體整體;還有一臺裝置位于瓶上部用于檢測瓶蓋缺陷及字體質(zhì)量。應用4臺相機保證完成對瓶體各個方向上的檢測。這樣便可以將檢測到的不合格產(chǎn)品剔除出去。具體過程為,待檢測產(chǎn)品通過光電傳感器通過系統(tǒng)總線把信號傳給視覺系統(tǒng),通過視覺系統(tǒng)的軟件設(shè)定可以實時的對產(chǎn)品進行檢測,如發(fā)現(xiàn)不合格產(chǎn)品,傳輸給PLC控制信號,PLC動作,驅(qū)動剔除裝置把不合格產(chǎn)品剔除到另一跳輸送帶上。

(三)算法

當然,對于不同的設(shè)備有不同的軟件,也就有不同的算法。在這里介紹一種使用的算法-susan算法。它是一種直接利用圖像灰度有效地進行邊緣、角點檢測和濾波等的低層次圖像處理算法,它不僅方法簡單,能在較強噪聲中提取出目標的特征(邊緣、角點),而且定位準確,并對局部噪聲不敏感。

系統(tǒng)考慮到以后可能會出現(xiàn)的擴展與生產(chǎn)線的增加使輸入輸出點增加,這里用到的控制裝置為西門子S7-200系列CPU224的PLC以便備用。具體設(shè)計圖如圖2所示。

其中,I0.1,I0.2分別為啟動按鈕與計數(shù)輸入,I0.3,I0.4,I0.5分別指示輸入,(這里沒有考慮瓶子上方的相機,如果有要求增加一個I0.6輸入點即可)Q0.0為系統(tǒng)輸出,即剔除裝置,Q0.1為系統(tǒng)指示燈。剔除裝置的參數(shù),輸出力:100公斤,伸出速度:190mm/s,回程速度:250mm/s,尺寸:600×600×600(mm)。

四、結(jié)語

本文所提供的設(shè)計方案涉及的問題及所提到的工藝要求,通過機器視覺是完全可以實現(xiàn)的。機器視覺的未來是非常樂觀的,相信在不斷提高自己的前提下,隨著國內(nèi)自動化程度的提高,整個社會對產(chǎn)品質(zhì)量要求的提升,不僅僅在食品飲料行業(yè)中,還有如電子與電氣制造,機械工程,汽車,制造業(yè)等行業(yè)中對生產(chǎn)效率要求的提升,機器視覺這個新產(chǎn)品,新概念也會深入人心。

參考文獻

[1]趙穎全,楊軍.西門子機器視覺系統(tǒng)在PET飲料瓶缺陷檢測中的應用[J].可編程控制器與工廠自動化, 2006(04).

[2]范祥,盧道華.機器視覺在工業(yè)領(lǐng)域中的研究應用[J].現(xiàn)代制造工程,2007(06):129-132.

[3]葉青松.基于機器視覺的工業(yè)檢測研究——實時藥九檢測系統(tǒng)[D].江南大學,2008(03).

篇3

基于力學特性的檢測方法

力學方法是利用食品與農(nóng)產(chǎn)品的力學特性而進行檢測的方法.利用聲波和振動可以測出食品的品質(zhì)指標以及檢測待測物內(nèi)部的組織狀態(tài)。如利用聲波透射法測定牛乳中脂肪的含量及大豆的水分:用超聲波在物體中密度有差異處的反射波測定法,檢查家禽的肉質(zhì),脂肪層厚度,里脊肉斷面等。國外研究者研討了多種基于動力學原理的農(nóng)產(chǎn)品硬度檢測方法,如機械沖擊產(chǎn)生的聲頻信號檢測,機械沖擊相應的頻率分析和水果沖擊力檢測。

基于電磁學特性的檢測方法

電磁法分為主動特性法和被動特性法兩種。主動特性法是利用待測物自身所具有的某種電磁學的測量方法;而被動特性法是將待測物置于電磁場內(nèi),利用其受電磁影響后反過來對外部環(huán)境施加影響的特性測量方法,例如核磁共振和電子自旋共振等。電磁@-TY法所需的設(shè)備相對比較簡單,數(shù)據(jù)的獲取和處理也比較容易,因此應用前景比較廣闊。

基于光學特性的檢測方法

紫外光譜法,可見光譜法,近紅外光譜法是食品內(nèi)部品質(zhì)無損檢測有效的方法。它是通過食品對光的吸收,散射,反射,透射等特性來確定食品內(nèi)部品質(zhì)的一種方法。該項技術(shù)可廣泛用于谷物,果樹等多種產(chǎn)品的化學成分分析,物理學品質(zhì)分析,色度學品質(zhì)分析。

基于放射線特性的檢測方法

x射線,B射線和可見光都具有透射,反射和漫射等性質(zhì).x射線技術(shù)主要是利用穿透能力較弱的x射線作為光源進行透視探查的技術(shù).因食品密度與金屬等物質(zhì)相比要小得多,因此所需x射線強度較小,通常稱其為軟x射線,其主要用于測定物體的密度差,判別內(nèi)部缺陷和異物檢出.如X射線圖像用于檢測雞肉內(nèi)部較深部位的骨頭,但對表面骨頭檢測比較困難,而可見光圖像則正相反.另外,軟x射線還可以用來檢測如柑橘中的皺皮等缺損現(xiàn)象,檢測水果損傷缺陷,如蘋果的水芯及損傷等。

機器視覺檢測技術(shù)

機器視覺技術(shù)是用各種成像系統(tǒng)代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。機器視覺的最終目標就是使計算機能像人一樣通過視覺觀察并理解世界,具有自主適應環(huán)境等能力。在實現(xiàn)最終目標前,人們努力的中期目標是建立一種視覺系統(tǒng),這個系統(tǒng)能夠通過視覺敏感和反饋的某種程度從而智能的完成一項任務。隨著圖像處理技術(shù)的發(fā)展和計算機軟硬件的開發(fā),食品品質(zhì)自動檢測和分級領(lǐng)域應用機器視覺系統(tǒng)也變得越來越具有吸引力。應以斌等人以表面色澤與固酸比為柑橘成熟度指標,建立了用于柑橘成熟度檢測的機器視覺系統(tǒng),并建立了利用協(xié)方差矩陣和樣本屬于桔黃色和綠色的概率來判斷柑橘成熟度的判別分析法,并以實測的固酸比值作為對照,對72枚柑橘樣本進行了試驗,柑橘成熟度的判別準確率達到91.67%。

生物傳感器技術(shù)

21世紀是生命科學的世紀,而生物傳感器橫跨生物,化學,物理,信息等領(lǐng)域,結(jié)合了生物技術(shù),材料技術(shù),納米技術(shù),微電子技術(shù)等,是一門交叉學科的研究與應用技術(shù),也是當今世界科學發(fā)展的前沿,引起各國的極大關(guān)注。生物傳感器是由產(chǎn)生信號的敏感元件和處理信號的輔助儀器兩部分組成的,敏感元件由生物活性單元(如酶,抗體,微生物,DNA等)和換能器組成,換能器可用來捕捉生物活性單元與目標物反應過程中的信號。生物活性單元引起的變化不同,信號處理的方法也不同。根據(jù)檢測信號的不同.可將生物傳感器分為電化學傳感器,阻抗生物傳感器,壓電生物傳感器和光生物傳感器。與各種傳統(tǒng)的化學傳感器,物理傳感器相比,具有選擇性好,xA-析速度快,靈敏度高,不需進行樣品預處理,可進行連續(xù)在線檢測,成本低等特點。生物傳感器在食品檢測中的應用非常廣泛,幾乎滲透到各個方面,包括食品基本成分的檢測,食品中添加劑的檢測,有毒有害成分的檢測等等。

展望

篇4

關(guān)鍵詞:自動報靶系統(tǒng);機器視覺;圖像識別;圖像配準;圖像增強

中圖分類號:TP212.12文獻標識碼:A文章編號:1009-3044(2008)33-1500-02

Summary on Automatic Target-scoring System

HUANG Ming, Wang Hao-hua, LIANG Xu

(School of Software Technology, Dalian Jiaotong University, Dalian 116028, China)

Abstract: An automatic target-scoring system is proposed, which based on machine vision. CCD camera was used to observe targets’ surface continuously. According to the feature and change of the images of targets’ surface observed by CCD, the technology of computer pattern recognition was used to detect the position of real shell in the target surface. Then the position was described in digital by coding target surface.In the process of observation, the technology on enhancement and matching of gray-scale, image matching technology in geometry, and wavelet transform algorithms were used to solve the effect on the accuracy of the identification due to changes in light, wind, and other factors. In practice, the system can achieve ideal accuracy, reduce the misstatements and omissions greatly. It was also high-precision, low-cost,and reliable system, can be used in military drill and shooting competitions. It will be meaningful and have good prospect.

Key words: automatic target-scoring system; machine vision; imagine recognition; imagine matching; imagine enhancement

1 引言

在專業(yè)與非專業(yè)軍事訓練中,實彈射擊是最基本的訓練項目。傳統(tǒng)的實彈射擊采用人工報靶。傳統(tǒng)人工報靶主要有四個方面的不足:1)依賴于報靶者的判靶經(jīng)驗,效率比較低。2)當靶板上彈著點多時,報靶員很難識別新舊彈孔,報靶誤差極大,直接影響射擊訓練質(zhì)量。3)射擊未完全結(jié)束時,補靶員現(xiàn)身靶壕外或在補靶員察看靶板報靶和補靶時,射擊位管理者若稍有疏忽,就易出現(xiàn)槍支走火,造成人員傷亡,安全隱患極大。4)容易出現(xiàn)弄虛作假的現(xiàn)象。為了克服傳統(tǒng)人工報靶有不足和滿足軍事訓練現(xiàn)代化需求,提高部隊射擊水平,自動報靶的研究和應用對推進軍隊現(xiàn)代化將具有普遍意義。本文介紹基于機器視覺的自動報靶系統(tǒng)的基本原理和關(guān)鍵技術(shù),該系統(tǒng)使用圖像識別,圖像配準和圖像增強等技術(shù),在實際的訓練和考核中能夠發(fā)揮較好的作用,有良好的應用前景。

2 圖像與圖像處理的概念

圖像(Image)就是采用各種觀測系統(tǒng)獲得的,能夠為人類視覺系統(tǒng)所感覺的實體。圖像的范圍非常廣泛,包括:各類圖片(Picture),如照片、X光片;各類光學圖像,如電影、電視畫面;人們的有形想像以及外部描述,繪畫、繪圖;等等。圖像處理技術(shù)可分為兩大類,即模擬圖像處理和數(shù)字圖像處理。

圖1 通用的數(shù)字圖像處理系統(tǒng)框圖

數(shù)字圖像處理是指,使用數(shù)字計算機對圖像進行加工與處理。傳統(tǒng)的數(shù)字圖像處理技術(shù)主要集中在圖像的獲取、變換、增加、恢復(還原)、壓縮編碼、分割與邊緣提取等方面;隨著計算機與信息技術(shù)的發(fā)展,圖像特征分析、圖像配準、圖像融合、圖像分類、圖像識別、基于內(nèi)容的圖像檢索與圖像數(shù)字水印等領(lǐng)域取得進展,這些圖像處理技術(shù)具有智能化功能,因而稱之為智能圖像處理技術(shù)。

數(shù)字圖像處理方法大致可分為兩大類,即空域法和變換域法。1)空域法是把圖像看作是平面中各個像素組成的集合,然后直接對這個二維函數(shù)進行相應的處理。2)變換域法是首先對圖像進行正交變換,得到變換域系數(shù)矩陣,然后再進行各種處理,處理后再將其反變換到空間域,得到處理結(jié)果。

3 基于機器視覺的自動報靶系統(tǒng)

此類產(chǎn)品是以計算機為圖像識別和處理理論為基礎(chǔ),它沒有在靶體上安裝任何光電傳感設(shè)備。在實彈射擊過程中,它使用攝像頭對常規(guī)的標準靶畫面進行采集,根據(jù)采集來的靶圖像的特點和變化,利用計算機圖像識別(Image Recognition)和處理技術(shù)找出靶圖像中的真實彈點,使用這種自動報靶系統(tǒng)就好像是使用了一個“電子眼”,它會代替報靶人員的眼睛,在整個實彈射擊過程中不間斷的對靶畫面進行觀測。對不同靶位上的每一次射擊都采用相同的算法、規(guī)則和精度來判定,不存在受主觀因素影響的問題。比手工報靶更客觀,更公正,有較高的可用性。

實現(xiàn)此系統(tǒng)的軟件核心技術(shù)主要是數(shù)字圖像處理技術(shù)中的計算機圖像識別、圖像配準以及圖像增加等技術(shù)。在觀測過程中,采用圖像灰度配準與增強技術(shù)以及圖像的幾何配準技術(shù)來解決由于光照變化、大風等干擾因素對識別精度的影響。在此過程中,還要由其他優(yōu)秀算法來配合,提高性能與精度,例如小波變換等。

3.1 基于機器視覺的自動報靶系統(tǒng)的實現(xiàn)原理

機器視覺的概念是利用CCD攝像機等設(shè)備代替人眼,結(jié)合計算機視覺、數(shù)字圖像處理、和計算機控制技術(shù)實現(xiàn)對攝像機所攝取的圖像的分析過程。

其核心原理是:在整個實彈射擊的過程中,利用CCD攝像機不間斷地對靶面進行觀測,根據(jù)采集的靶面圖像的特點和變化,利用計算機圖像識別技術(shù)檢測靶面圖像中的真實彈點,然后通過彈點在靶面圖中的位置來對著彈點區(qū)域進行編碼。在觀測過程中,采用圖像灰度配準與增強技術(shù)以及圖像的幾何配準技術(shù)來解決由于光照變化、大風等干擾因素對識別精度的影響。在此過程中,還要由其他優(yōu)秀算法來配合,提高性能與精度,例如小波變換等。

通過以上論述可見,本系統(tǒng)由圖像采集設(shè)備、圖形采集卡、圖形處理軟件、計算機及顯示部分組成。具體的配置如下:購買一個CCD攝像頭、一塊圖形采集卡、一臺普通計算機及編寫相應的軟件,其中圖形采集卡可選擇大恒公司或杭州??低晹?shù)字技術(shù)有限公司生產(chǎn)的。為完成本系統(tǒng)的功能與性能指標,主要工作集中在軟件的編程與實現(xiàn)上。

3.2 基于機器視覺的自動報靶系統(tǒng)的核心技術(shù)

實現(xiàn)本系統(tǒng)的軟件核心技術(shù)主要是數(shù)字圖像處理技術(shù)中的計算機圖像識別、圖像配準以及圖像增加等技術(shù)。

3.2.1 圖像識別技術(shù)

圖像識別是對圖像進行預處理后,再經(jīng)分割和描述,提取有效的特征,進而加以判決分類的圖像處理技術(shù)。

一個圖像識別系統(tǒng)可分為三個主要部分,第一部分是圖像信息的獲取,對圖像識別來說就是把圖片、底片、文字圖形等用采集設(shè)備變換為電信號。第二部分是信息的特征提取,它的作用在于把調(diào)查了解到的數(shù)據(jù)材料進行加工、整理、分析、歸納以去偽存真,抽出能反映事物本質(zhì)的特征。第三部分是判決,做出結(jié)論的過程,與判決的方式密切相關(guān)。

圖2 圖像識別系統(tǒng)框圖

在圖像識別的發(fā)展過程中,出現(xiàn)了四類有代表性的理論和方法。即統(tǒng)計圖像識別方法、句法(或結(jié)構(gòu))圖像識別方法、模糊圖像識別方法和神經(jīng)網(wǎng)絡(luò)圖像識別方法。

3.2.2 圖像配準技術(shù)

圖像配準是指同一目標的兩幅(或兩幅以上)圖像在空間位置上的對準。圖像配準的技術(shù)過程稱為圖像匹配(Image matching)或圖像相關(guān)(Image correlation)。圖像配準可分為半自動配準和全自動配準。

全自動配準是直接利用計算機完成圖像配準工作,大致可分為基于灰度與基于特征兩類。基于灰度的方法有:空間相關(guān)法、不變矩陣、頻域相關(guān)法。此方法具有精度高的優(yōu)點,但計算復雜度高。基于特征的方法有兩個重要環(huán)節(jié):特征提取和特征匹配。本方法與小波變換等結(jié)合,進一步提高了圖像配準的精度與運算速度。

3.2.3 圖像增加技術(shù)

圖像增加的目的有兩個:一是改善圖像的視覺效果,提高圖像成分的清晰度;二是使圖像變的更有利于計算機處理。

圖像增加的方法一般分為空間域和變換域兩大類??臻g域方法直接對圖像像素的灰度進行處理。變換域方法在圖像的某個變換域中對變換系統(tǒng)進行處理,然后通過逆變換獲得增加圖像。常用的圖像增加方法有:空間域單點增加、圖像平滑、圖像銳化、圖像濾波與圖像增加。

4 總結(jié)與展望

運用數(shù)字圖像處理技術(shù)的自動報靶系統(tǒng),在國內(nèi)、外都有相應的研究,但實際系統(tǒng)的功能需要與性能指標各有差異,所應用的原理和方法手段不近相同,所以可從另外方面進行開發(fā),拓展數(shù)字圖像處理的領(lǐng)域,滿足不同系統(tǒng)的不同需要。

在本系統(tǒng)中,力求將其它優(yōu)秀的算法,嫁接到圖像處理中,以提高圖像處理的性能與精度,在我軍某坦克基地的實際應用中,達到了預期的目標。由于本系統(tǒng)是一室外項目,光照變化、大風等干擾因素會對識別精度造成一定影響,還需通過一些方法或算法來彌補這些不足。本系統(tǒng)所要研究報靶系統(tǒng)所采用的方法不僅有著精度高的優(yōu)點,而且完全滿足部隊實彈射擊需求,稍作改動之后還可用于運動類報靶,具有廣闊的應用前景和研究價值。

參考文獻:

[1] 張軍,顏樹華,徐琰.自動報靶系統(tǒng)的研究進展[J].激光與紅外,2006,36(12):1152- 1154.

[2] 楊子寧.光電自動報靶系統(tǒng)的設(shè)計與實現(xiàn)[J].科學技術(shù)與工程, 2007,7(1):102-104.

[3] 陳海峰.基于圖像處理技術(shù)的自動報靶系統(tǒng)研究[D].南京航空航天大學,2005.

篇5

關(guān)鍵詞: 人工智能 發(fā)展過程 研究熱點 應用領(lǐng)域 未來發(fā)展

一、人工智能概述

人工智能(Artificial Intelligence,簡稱AI),也稱機器智能,它是計算機科學、控制論、信息論、神經(jīng)生理學、心理學、語言學等多種學科互相滲透而發(fā)展起來的一門綜合性學科。從計算機應用系統(tǒng)角度來看,人工智能是研究如何制造出智能機器或智能系統(tǒng),實現(xiàn)模擬人類智能活動的能力,以延伸人們智能的科學。人工智能是一門交叉學科,是一門涉及心理學、認知科學、思維科學、信息科學、系統(tǒng)科學和生物科學等多學科的綜合性技術(shù)學科,目前已在知識處理、模式識別、自然語言處理、博弈、自動定理證明、自動程序設(shè)計、專家系統(tǒng)、知識庫、智能機器人等多個領(lǐng)域取得舉世矚目的成果,并形成了多元化的發(fā)展方向。

二、人工智能的發(fā)展過程

人工智能經(jīng)歷了三次飛躍階段:第一次是實現(xiàn)問題求解,代替人完成部分邏輯推理工作,如機器定理證明和專家系統(tǒng);第二次是智能系統(tǒng)能夠和環(huán)境交互,從運行的環(huán)境中獲取信息,代替人完成包括不確定性在內(nèi)的部分思維工作,通過自身的動作,對環(huán)境施加影響,并適應環(huán)境的變化,如智能機器人;第三次是智能系統(tǒng),具有類人的認知和思維能力,能夠發(fā)現(xiàn)新的知識,去完成面臨的任務,如基于數(shù)據(jù)挖掘的系統(tǒng)。

三、人工智能的研究熱點

AI研究出現(xiàn)了新的,這一方面是因為在人工智能理論方面有了新的進展,另一方面是因為計算機硬件突飛猛進地發(fā)展。隨著計算機速度的不斷提高、存儲容量的不斷擴大、價格的不斷降低,以及網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,許多原來無法完成的工作現(xiàn)在已經(jīng)能夠?qū)崿F(xiàn)。目前人工智能研究的三個熱點是:智能接口、數(shù)據(jù)挖掘、主體及多主體系統(tǒng)。

1.智能接口技術(shù)是研究如何使人們能夠方便自然地與計算機交流。為了實現(xiàn)這一目標,要求計算機能夠看懂文字、聽懂語言、說話表達,甚至能夠進行不同語言之間的翻譯,而這些功能的實現(xiàn)又依賴于知識表示方法的研究。因此,智能接口技術(shù)的研究既有巨大的應用價值,又有基礎(chǔ)的理論意義。目前,智能接口技術(shù)已經(jīng)取得了顯著成果,文字識別、語音識別、語音合成、圖像識別、機器翻譯及自然語言理解等技術(shù)已經(jīng)開始實用化。

2.數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但是又潛在有用的信息和知識的過程。數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的研究目前已經(jīng)形成了三根強大的技術(shù)支柱:數(shù)據(jù)庫、人工智能和數(shù)理統(tǒng)計。主要研究內(nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉庫、可視化技術(shù)、定性定量互換模型、知識表示方法、發(fā)現(xiàn)知識的維護和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識發(fā)現(xiàn)及網(wǎng)上數(shù)據(jù)挖掘等。

3.主體系統(tǒng)是具有信念、愿望、意圖、能力、選擇、承諾等心智狀態(tài)的實體,比對象的粒度更大,智能性更高,而且具有一定的自主性。主體試圖自治、獨立地完成任務,而且可以和環(huán)境交互,與其他主體通信,通過規(guī)劃達到目標。多主體系統(tǒng)主要研究在邏輯上或物理上分離的多個主體之間進行協(xié)調(diào)智能行為,最終實現(xiàn)問題求解。多主體系統(tǒng)試圖用主體來模擬人的理,主要應用在對現(xiàn)實世界和社會的模擬、機器人及智能機械等領(lǐng)域。目前對主體和多主體系統(tǒng)的研究主要集中在主體和多主體理論、主體的體系結(jié)構(gòu)和組織、主體語言、主體之間的協(xié)作和協(xié)調(diào)、通信和交互技術(shù)、多主體學習及多主體系統(tǒng)應用等方面。

四、人工智能的應用領(lǐng)域

1.專家系統(tǒng)

專家系統(tǒng)是一個具有大量專門知識與經(jīng)驗的程序系統(tǒng),專家系統(tǒng)存儲著某個專門領(lǐng)域中經(jīng)過事先總結(jié)、分析并按某種模式表示的專家知識,以及擁有類似于領(lǐng)域?qū)<医鉀Q實際問題的推理機制。專家系統(tǒng)的開發(fā)和研究是人工智能中最活躍的一個應用研究領(lǐng)域,涉及社會各個方面。

2.知識庫系統(tǒng)

知識庫系統(tǒng)也叫數(shù)據(jù)庫系統(tǒng),是儲存某學科大量事實的計算機軟件系統(tǒng),它可以回答用戶提出的有關(guān)該學科的各種問題。知識庫系統(tǒng)的設(shè)計是計算機科學的一個活躍的分支。為了有效地表示、儲存和檢索大量事實,已經(jīng)發(fā)展出了許多技術(shù)。但是在設(shè)計智能信息檢索系統(tǒng)時還是遇到很多問題,包括對自然語言的理解,根據(jù)儲存的事實演繹答案的問題、理解詢問和演繹答案所需要的知識都可能超出該學科領(lǐng)域數(shù)據(jù)庫所表示的知識。

3.物景分析

計算機視覺已從模式識別的一個研究領(lǐng)域發(fā)展為一門獨立的學科。視覺是感知問題之一。整個感知問題的要點是形成一個精練的表示,以表示難以處理的、極其龐大的未經(jīng)加工的輸入數(shù)據(jù)。最終表示的性質(zhì)和質(zhì)量取決于感知系統(tǒng)的目標。機器視覺的前沿研究領(lǐng)域包括實時并行處理、主動式定性視覺、動態(tài)和時變視覺、三維景物的建模與識別、實時圖像壓縮傳送和復原、多光譜和彩色圖像的處理與解釋等。機器視覺已在機器人裝配、衛(wèi)星圖像處理、工業(yè)過程監(jiān)控、飛行器跟蹤和制導及電視實況轉(zhuǎn)播等領(lǐng)域獲得極為廣泛的應用。

4.模式識別

模式識別就是識別出給定物體所模仿的標本或標識。計算機模式識別系統(tǒng)能夠彌補計算機對外部世界感知能力低下的缺陷,使計算機能夠通過感官接受外界信息,識別和理解周圍環(huán)境。模式識別在二維的文字、圖形和圖像的識別方面已取得許多成果,在三維景物、活動目標的識別和分析方面是目前研究的熱點,同時它還是智能計算機和智能機器人研究的十分重要的基礎(chǔ)。此外,人工智能還在機器視覺、組合調(diào)度問題、自然語言理解、機器學習、博弈、定理證明等研究應用領(lǐng)域發(fā)揮著重要作用??梢哉f人工智能已深入各行各業(yè),對人類社會作出了巨大的貢獻。

5.機器人

機器人學所研究的問題,從機器人手臂的最佳移動到實現(xiàn)機器人目標的動作序列的規(guī)劃方法,無所不包。盡管已經(jīng)建立了一些比較復雜的機器人系統(tǒng),但是現(xiàn)在工業(yè)上運行的機器人都是一些按預先編好的程序執(zhí)行某些重復作業(yè)的簡單裝置,大多數(shù)工業(yè)機器人是“盲人”。機器人和機器人學的研究促進了許多人工智能思想的發(fā)展。智能機器人的研究和應用體現(xiàn)出廣泛的學科交叉,涉及眾多課題。機器人已在工業(yè)、農(nóng)業(yè)、商業(yè)、旅游業(yè)、空中和海洋及國防等多個領(lǐng)域獲得越來越普遍的應用。

五、人工智能的未來發(fā)展

目前絕大多數(shù)人工智能系統(tǒng)都是建立在物理符號系統(tǒng)假設(shè)之上的。在尚未出現(xiàn)能與物理符號系統(tǒng)假設(shè)相抗衡的新的人工智能理論之前,無論從設(shè)計原理還是從已取得的實驗結(jié)果來看,Soar在探討智能行為的一般特征和人類認知的具體特征的艱難征途上都取得了有特色的進展或成就,處在人工智能研究的前沿。上世紀80年代,以NewellA為代表的研究學者總結(jié)了專家系統(tǒng)的成功經(jīng)驗,吸收了認知科學研究的最新成果,提出了作為通用智能基礎(chǔ)的體系結(jié)構(gòu)Soar。目前的Soar已經(jīng)顯示出強大的問題求解能力。在Soar中已實現(xiàn)了30多種搜索方法,實現(xiàn)了若干知識密集型任務(專家系統(tǒng)),如RI等。對于人工智能未來的發(fā)展方向,專家們通過一些前瞻性研究可以看出未來人工智能可能會向以下幾個方面發(fā)展:模糊處理、并行化、神經(jīng)網(wǎng)絡(luò)及其情感。

目前,人工智能的推理功能已獲突破,學習及聯(lián)想功能正在研究之中,下一步就是模仿人類右腦的模糊處理功能和整個大腦的并行化處理功能。人工神經(jīng)網(wǎng)絡(luò)是未來人工智能應用的新領(lǐng)域。未來智能計算機的構(gòu)成,可能就是作為主機的馮?諾依曼型機與作為智能的人工神經(jīng)網(wǎng)絡(luò)的結(jié)合。研究表明:情感是智能的一部分,而不是與智能相分離的,因此人工智能領(lǐng)域的下一個突破可能在于賦予計算機情感能力。情感能力對于計算機與人的自然交往至關(guān)重要。

根據(jù)這些前瞻性研究我們也可以通過想象模擬勾畫出人工智能未來發(fā)展的三個階段。

1.融合時期(2010―2020年)

(1)用語言操縱和控制的智能化設(shè)備十分普及,像遠程醫(yī)療這樣的服務也更為完善。

(2)以計算機和互聯(lián)網(wǎng)為基礎(chǔ)的遠程教育十分普及,在家就可以上大學。

(3)在身體里植入許多不同功能的芯片已不新奇。

(4)量子計算機和DNA計算機會有更大發(fā)展,新材料不斷問世。

(5)抗病毒程序可以防止各種非自然因素引發(fā)災難。

2.自信時期(2020―2030年)

(1)智能化計算機和互聯(lián)網(wǎng)既能自我修復,也能自行進行研究、生產(chǎn)產(chǎn)品。

(2)一些新型材料的出現(xiàn),促使智能化向更高層次發(fā)展。

(3)有了高水準智能化技術(shù)的協(xié)助,人們“定居火星夢”可能性大增。

3.非神秘時期(2030―2040年)

(1)新的全息模式世界將取代原有幾何模式的世界。

(2)人們對一些目前無法解釋的自然現(xiàn)象會有更完善的解釋。

(3)人工智能可以模仿人類的智能,因此會出現(xiàn)有關(guān)法律來規(guī)范這些行為。

篇6

關(guān)鍵詞:立體匹配;初始視差;能量函數(shù);置信傳播;快速收斂

中圖分類號: TP391.413

文獻標志碼:A

Abstract: Concerning the high computation complexity and low efficiency in traditional stereo matching method based on Belief Propagation (BP), a fast convergent stereo matching algorithm based on Sum of Absolute Difference (SAD) algorithm and BP algorithm was proposed. Firstly, the SAD matching method was used as a similarity decision criterion to determine the initial disparity map. When the energy function was constructed, the initial parallax map was used as a limit of function to get the optimization of disparity distribution by BP. And when calculating the confidence level of each pixel in the optimization process, the algorithm only utilized the information translated from the neighboring pixels in an adaptive support window, while ignoring the impact of the pixels beyond the window, then the nodes of BP were reduced and the convergence speed was improved. The experimental results show that the proposed algorithm can reduce matching computation time by 50%-60% and improve efficiency while maintaining the matching accuracy, and the proposed algorithm lays the foundation for the realtime applications.

Key words: stereo matching; initial disparity; energy function; Belief Propagation (BP); fast convergence

0引言

立體匹配的目的是尋找相同場景不同視角圖像中像素點的對應關(guān)系,消除立體匹配的歧義性和模糊性是機器視覺比較困難的技術(shù)之一。隨著機器視覺的發(fā)展,立體匹配旨在獲取高質(zhì)量的視差圖,這已經(jīng)成為了重要的研究內(nèi)容,并且取得了很大的進展,出現(xiàn)了許多經(jīng)典的算法,根據(jù)優(yōu)化方式不同可分為基于區(qū)域的算法(localbased algorithm)和基于全局的算法(globalbased algorithm)兩種方法[1-2]。

區(qū)域立體匹配算法主要是采用局部優(yōu)化方法進行視差值估計,它主要包括像素灰度絕對誤差和(Sum of Absolute Difference, SAD)、像素灰度平方差別之和(Sum of Squared Differences, SSD)以及歸一化互相關(guān)(Normalized Cross Correlation, NCC)等算法。區(qū)域立體匹配算法具有匹配效率高、速度比較快、能滿足實時性要求、占內(nèi)存少等優(yōu)點,但是其獲取的視差精確性較低、抗噪性弱,對弱紋理區(qū)域、重復紋理區(qū)域、視差不連續(xù)區(qū)域和遮擋區(qū)域匹配效果不理想。

全局算法主要是采用了全局的優(yōu)化理論方法估計視差,建立全局能量函數(shù),通過最小化全局能量函數(shù)得到最優(yōu)視差值。主要的算法有置信傳播(Belief Propagation, BP)、圖割(Graph Cut, GC)、動態(tài)規(guī)劃(Dynamic Programming, DP)等算法。相對局部匹配算法,全局算法具有匹配精度高的特點,但是匹配的速度較慢。

其中具有代表性的BP算法[3-9],將待匹配空間看作是馬爾可夫隨機場,使用貝葉斯方法來建立模型,然后利用消息傳遞、迭代優(yōu)化原理尋找整幅圖像的全局能量最優(yōu)值,從而估計視差值。傳統(tǒng)的BP算法需要遍歷圖像中各節(jié)點的取值范圍,不斷迭代更新消息,運算復雜且巨大,計算時間較長。因此本文提出一種基于SAD和BP的快速收斂的立體匹配算法,有效地減少消息迭代更新的節(jié)點數(shù)并使得更新的消息趨于收斂,降低運算的復雜度,從而提高算法運行的效率。

1置信傳播算法

置信傳播算法是將待匹配空間看作是馬爾可夫隨機場,把圖像中的像素點與馬爾可夫隨機場中的節(jié)點一一對應起來,并采用貝葉斯最大后驗概率估計方法對馬爾可夫網(wǎng)絡(luò)中節(jié)點間的消息進行迭代和更新,求出迭代后節(jié)點的最大后驗概率及置信度信息,再根據(jù)節(jié)點的置信度得到視差圖。節(jié)點間的消息傳遞示意圖如圖1所示。

從圖3中對比不同算法在Tsukuba上的實驗結(jié)果可以得到,本文算法結(jié)果誤差相比傳統(tǒng)BP算法的誤差更小,在弱紋理和重復紋理區(qū)域具有更好的效果;與改進的SAD算法結(jié)果誤差相當,保持了較高精度的匹配效果。但是相對于傳統(tǒng)BP算法,本文算法在運算時間上有優(yōu)勢,圖5為本文算法實驗過程中Tsukuba測試圖未收斂點數(shù)的情況,從圖5中可得出隨著迭代次數(shù)的增加,圖像的大部分像素點已經(jīng)收斂,說明需要更新迭代的像素點數(shù)是急劇減少,使得運算時間大大降低。而傳統(tǒng)算法每一次迭代都要遍歷所有的像素點,使得運算時間隨迭代次數(shù)成倍增加,效率比較低。為更直接地表現(xiàn)傳統(tǒng)BP算法和本文算在運行時間上的對比,本文采用歸一化時間對數(shù)圖表進行了圖示,如圖6所示。圖6中“系列1”和“系列2”分別為本文算法和傳統(tǒng)BP算法的歸一化時間序列,由圖6可知:在保持相似匹配精度的基礎(chǔ)上,本文算法的運行時間在高迭代次數(shù)(30次以上)時降低了50%~60%,大大地提高了匹配效率,為實時匹配應用打下了基礎(chǔ)。

4結(jié)語

本文通過將局部算法SAD和傳統(tǒng)的置信傳播(BP)算法相結(jié)合,提出了一種新的快速收斂的立體匹配算法,它在保持良好的算法結(jié)果的同時,也很好地改善了傳統(tǒng)算法存在的運算次數(shù)較多、效率低下的問題。通過實驗表明,在置信傳播建立全局能量函數(shù)時,加入局部算法SAD的結(jié)果,可以減少視差搜索的范圍;在置信傳播優(yōu)化過程中,

引入了置信度和優(yōu)化視差值收斂的概念,簡化了傳統(tǒng)算法視差值的優(yōu)化過程

引入將置信度和優(yōu)化視差值的收斂的概念,降低了傳統(tǒng)算法視差值的優(yōu)化過程此處語句不通順,是降低了優(yōu)化過程嗎?還是增強了?請作相應調(diào)整。,從而在兩方面實現(xiàn)了快速的立體匹配,為三維重建、路徑規(guī)劃以及機器導航等提供了較為精確的視差圖。

參考文獻:

[1]ZHAI Z. The research of stereo matching algorithm [D]. Beijing: Beijing Institute of Technology, 2010.(翟振剛.立體匹配算法研究[D].北京:北京理工大學,2010.)

[2]LIU Z. Matching algorithm research for stereo vision [D]. Beijing: Graduate University of Chinese Academy of Sciences, 2011.(劉志花.面向立體視覺的匹配算法研究[D].北京:中國科學院研究生院,2011.)

[3]SUN J, ZHENG N N, SHUM H Y. Stereo matching using belief propagation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(7): 787-800.

[4]IHLRE A T, FISCHER J W III, WILLSKY A S. Loopy belief propagation: convergence and effects of message errors [J]. The Journal of Machine Learning Research, 2005, 6: 905-936.

[5]WEISS Y, FREEMAN W T. On the optimality of solutions of the maxproduct beliefpropagation algorithm in arbitrary graphs [J]. IEEE Transactions on Information Theory, 2001, 47(2): 736-744.

[6]YANG Q, WANG L, YANG R. Stereo matching with colorweighted correlation, hierarchical belief propagation, and occlusion handling [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(3): 492-504.

[7]KLAUS A, SORMANN M. Segmentbased stereo matching using belief propagation and a selfadapting dissimilarity measure [C]// Proceedings of the 2006 IEEE International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2006: 15-18.

[8]FELZENSZWALB P, HUTTENLOCHER D P. Efficient belief propagation for early vision [J]. International Journal of Computer Vision, 2006, 70(1): 41-54.

[9]TAPPEN M F, FREEMAN W T. Comparison of graph cuts with belief propagation for stereo, using identical MRF parameters [C]// Proceedings of the 2003 IEEE International Conference on Computer Vision. Washington, DC: IEEE Computer Society, 2003: 900-906.

[10]LI C M, XU C Y, GUI C F.Level set evolution without reinitialization: a new variational formulation [C]// Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2005: 430-436.

[11]ZHANG H, LIU Y, YANG Y. Stereo matching algorithm based on fastconverging belief propagation [J]. Journal of Computer Applications, 2013, 33(2): 484-486.(張紅穎,劉奕萱,楊宇.快速收斂的置信度傳播立體匹配算法[J].計算機應用,2013,33(2):484-486.)

[12]AMBROSCH K, KUBINGER W. Accurate hardwarebased stereo vision [J]. Computer Vision and Image Understanding, 2010, 114(11): 1303-1316.

[13]ZHANG Y, LOU B. An algorithm fusion of adaptive supportweight approach and belief propagation for stereo matching [J]. Journal of Hangzhou Dianzi University, 2012, 32(2): 10-13.(張永平,樓斌.融合自適應權(quán)重和置信傳播的立體匹配算法[J].杭州電子科技大學學報,2012,32(2):10-13.)

[14]CAO Y, DA F. A stereo matching algorithm based on selective belief propagation [J]. Journal of Southeast University: Natural Science Edition, 2011, 41(5): 1013-1018.(曹云云,達飛鵬.一種具有選擇性的置信度傳播立體匹配算法[J].東南大學學報:自然科學版,2011,41(5):1013-1018.)

篇7

基于組件的客戶反應行為管理研究

基于GSM短消息的解碼方法及其程序?qū)崿F(xiàn)

凌陽單片機在指紋識別系統(tǒng)中的應用

信息技術(shù)與課程整合教學的研究與實踐

基于并行算法的生命游戲分解策略的性能分析

科技論文二次退修的成因及避免對策

案例教學法在《PHOTOSHOP平面設(shè)計》課程中的運用

重點學科管理系統(tǒng)的網(wǎng)上實現(xiàn)

淺談信息素養(yǎng)與信息技術(shù)教育

瀕危植物長柄雙花木生態(tài)遺傳分化的同工酶分析

江西省環(huán)境污染物超標原因分析

求包含多邊形的最小正三角形的遺傳算法

論新技術(shù)支持下的數(shù)學概念教學

偏導數(shù)與方向?qū)?shù)的關(guān)系

異步電動機直接轉(zhuǎn)矩控制系統(tǒng)設(shè)計

碘酸鉀存在下吡啶的極譜平行催化氫波研究

有機化學實驗“綠色化”教改淺談

“協(xié)作——探究式”實驗教學模式的應用——關(guān)于分析化學設(shè)計性實驗教學改革的探討

江西高師體育教育專業(yè)課程設(shè)置的比較研究

四種水生植物對富營養(yǎng)化水體中磷去除效果的研究

不同播栽期對清香型烤煙新品系C_2生長發(fā)育及產(chǎn)量質(zhì)量的影響

多自由度系統(tǒng)微振動數(shù)態(tài)的仿真實現(xiàn)研究

一類二階非線性奇攝動方程的激波解

基于模糊綜合評判的生物醫(yī)學工程實驗教學質(zhì)量評估

光電耦合器典型應用電路剖析

稀土永磁同步電動機在油田抽油機上的應用與分析

多發(fā)射處理器的指令調(diào)度算法研究

鐵路貨運營銷綜合信息平臺研究

基于BNF的OBO規(guī)范化和OWLDL轉(zhuǎn)換研究

提高計算機等級考試C++通過率的幾點嘗試

醫(yī)學信息中心博客在基層醫(yī)學科研中的作用

淺析我國古代村落的規(guī)劃思想——以廉江市坡頭村為例

用于生物柴油生產(chǎn)的非均相催化劑研究進展

江西省少數(shù)民族地區(qū)中學體育課和體育活動開展影響因素分析

新課程標準理念下擲標槍的教學策略研究

對體育鍛煉和認知干預提高貧困大學生心理健康的探究

安??h城全民健身活動條件資源整合與開發(fā)對策的調(diào)查研究

阿爾采末病發(fā)病機制研究進展新視點

克林霉素不良反應進展

電暈極化偶氮化合物薄膜倍頻弛豫特性研究

硅膠負載硅鎢酸催化合成丁酮乙二醇縮酮

鏈烷烴偏心因子的定量構(gòu)效關(guān)系研究

三唑磷降解菌的篩選、鑒定及其系統(tǒng)發(fā)育分析

被動吸煙對小鼠運動能力的影響

渭干河-庫車河三角洲日照時數(shù)變化特征

印刷線路板廠有機顯影廢水處理方法研究

基于DHT11的無線溫濕度傳感器網(wǎng)絡(luò)節(jié)點的設(shè)計

基于Wup的語義相似度計算的全局本體語義分析方法

基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)模型在地震預報中的應用

變精度粗糙集模型及其一個性質(zhì)的推廣

篇8

關(guān)鍵詞:決策支持系統(tǒng) 人工智能 專家系統(tǒng)

一、智能決策技術(shù)概述

1.決策支持系統(tǒng)的形成

隨著計算機技術(shù)和應用的發(fā)展,如科學計算、數(shù)據(jù)處理、管理信息系統(tǒng)的發(fā)展以及運籌學和管理科學的應用,為決策支持系統(tǒng)的形成打下了基礎(chǔ)。決策支持系統(tǒng)(Decision Support System—DDS)是80年代迅速發(fā)展起的新型計算機學科。70年代初由美國M.S.Scott Morton在《管理決策系統(tǒng)》一文中首先提出決策支持系統(tǒng)的概念。

DSS實質(zhì)上是在管理信息系統(tǒng)和運籌學的基礎(chǔ)上發(fā)展起來的。管理信息系統(tǒng)重點在對大量數(shù)據(jù)的處理。運籌學在運用模型輔助決策體現(xiàn)在單模型輔助決策上。隨著新技術(shù)的發(fā)展,所需要不得不解決的問題會愈來愈復雜,所涉及的模型會愈來愈多,模型類型也由數(shù)學模型擴充數(shù)據(jù)處理模型。模型數(shù)量也愈來愈多。這樣,對多模型輔助決策問題,在決策支持系統(tǒng)出現(xiàn)之前是靠人來實現(xiàn)模型間的聯(lián)合和協(xié)調(diào)。決策支持系統(tǒng)的出現(xiàn)就是要解決由計算機自動組織和協(xié)調(diào)多模型運行,對大量數(shù)據(jù)庫中數(shù)據(jù)的存取和處理,達到更高層次的輔助決策能力。決策支持系統(tǒng)的新特點就是增加了模型庫和模型庫管理系統(tǒng),它把眾多的模型(數(shù)學模型和數(shù)據(jù)處理模型以及更廣泛的模型)有效地組織和存儲起來,并且建立了模型庫和數(shù)據(jù)庫的有機結(jié)合。這種有機結(jié)合適應人機交互功能,自然促使新型系統(tǒng)的出現(xiàn),即DDS的出現(xiàn)。它不同于MIS數(shù)據(jù)處理,也不同于模型的數(shù)值計算,而是它們的有機集成。它既有數(shù)據(jù)處理功能又具有數(shù)值計算功能。

決策支持系統(tǒng)概念及結(jié)構(gòu)。決策支持系統(tǒng)是綜合利用大量數(shù)據(jù),有機組合眾多模型(數(shù)學模型與數(shù)據(jù)處理模型等),通過人機交互,輔助各級決策者實現(xiàn)科學決策的系統(tǒng)。

DSS使人機交互系統(tǒng)、模型庫系統(tǒng)、數(shù)據(jù)庫系統(tǒng)三者有機結(jié)合起來。它大大擴充了數(shù)據(jù)庫功能和模型庫功能,即DSS的發(fā)展使管理信息系統(tǒng)上升到?jīng)Q策支持系統(tǒng)的新臺階上。DSS使那些原來不能用計算機解決的問題逐步變成能用計算機解決。

2.人工智能概念和研究范圍

(1)人工智能定義。由計算機來表示和執(zhí)行人類的智能活動(如判斷、識別、理解、學習、規(guī)劃和問題求解等)就是人工智能。人工智能的研究在逐步擴大機器智能,使計算機逐步向人的智能靠近。

(2)人工智能的研究范圍。人工智能研究的基本范圍有:問題求解、邏輯推理和定理證明、自然語言處理、自動程序設(shè)計、學習、專家系統(tǒng)、機器人學、機器視覺、智能檢索系統(tǒng)、組合高度問題、系統(tǒng)與表達語言等;其主要研究領(lǐng)域有:自然語言處理、機器人學、知識工程。

自然語言處理:語音的識別與合成,自然語言的理解和生成,機器翻譯等。

機器人學:從操縱型、自動型轉(zhuǎn)向智能型。在重、難、險、害等工作領(lǐng)域中推廣使用機器人。

知識工程:研究和開發(fā)專家系統(tǒng)。目前人工智能的研究中,最接近實用的成果是專家系統(tǒng)。專家系統(tǒng)在符號推理、醫(yī)療診斷、礦床勘探、化學分析、工程設(shè)計、軍事決策、案情分析等方面都取得明顯的效果。

3.決策支持新技術(shù)

(1)數(shù)據(jù)倉庫的興起和概念。數(shù)據(jù)倉庫(Data Warehouse—DW)的概念是Prism Solutions公司副總裁W.H.Inmon在1992年出版的書《建立數(shù)據(jù)倉庫》(Building the Data Warehouse)中提出的。數(shù)據(jù)倉庫的提出是以關(guān)系數(shù)據(jù)庫,并行處理和分布式技術(shù)的飛速發(fā)展為基礎(chǔ),它是解決信息技術(shù)在發(fā)展中一方面擁有大量數(shù)據(jù),另一方面有用信息卻很貧乏(Data rich—Information poor)這種不正?,F(xiàn)象的綜合解決方案。

W.H.Inmon在《建立數(shù)據(jù)倉庫》一書中,對數(shù)據(jù)倉庫定義為:數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,用于支持經(jīng)營管理中決策制定過程。

傳統(tǒng)數(shù)據(jù)庫用于事務處理,也叫操作型處理,是指對數(shù)據(jù)庫聯(lián)機進行日常操作,即對一或一組記錄的查詢和修改,主要為企業(yè)特定的應用服務的。用戶關(guān)心的是響應時間,數(shù)據(jù)的安全性和完整性。數(shù)據(jù)倉庫用于決策支持,也稱分析型處理,用于決策分析,它是建成立決策支持系統(tǒng)的基礎(chǔ)。

(2)數(shù)據(jù)倉庫的特點。數(shù)據(jù)倉庫是面向主題的:主題是數(shù)據(jù)歸類的標準,每一個主題基本對應一個宏觀的分析領(lǐng)域。

數(shù)據(jù)倉庫是集成的:數(shù)據(jù)進入數(shù)據(jù)倉庫之前,必須經(jīng)過加工與集成。對不同的數(shù)據(jù)來源進行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異義,異名同義,單位不統(tǒng)一,字長不一致等??傊畬⒃紨?shù)據(jù)結(jié)構(gòu)作一個從面向應用到面向主題的大轉(zhuǎn)變。

數(shù)據(jù)倉庫是穩(wěn)定的:數(shù)據(jù)倉庫中包括了大量的歷史數(shù)據(jù)。數(shù)據(jù)經(jīng)集成進入數(shù)據(jù)倉庫后是極少或根本不更新的。

數(shù)據(jù)倉庫是隨時間變化的:數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)時限在5-10年,故數(shù)據(jù)的鍵碼包含時間項,標明數(shù)據(jù)的歷史時期,這適合DSS進行時間趨勢分析。

數(shù)據(jù)倉庫中數(shù)據(jù)很大:通常的數(shù)據(jù)倉庫的數(shù)據(jù)量為10GB級,大型的是一個TB級數(shù)據(jù)量。數(shù)據(jù)中索引和綜合數(shù)據(jù)占2/3,原始數(shù)據(jù)占1/3。

數(shù)據(jù)倉庫軟、硬件要求:需要一個巨大的硬件平臺和一個并行的數(shù)據(jù)庫系統(tǒng)。

(3)數(shù)據(jù)開采的概念及方法。1995年在加拿大召開了第一屆知識發(fā)現(xiàn)(Knowledge Discovery in Database—KDD)和數(shù)據(jù)開采(Data Mining—DM)國際學術(shù)會議以后,“數(shù)據(jù)開采”開始流行,它是“知識發(fā)現(xiàn)”概念的深化,知識發(fā)現(xiàn)與數(shù)據(jù)開采是人工智能、機器學習與數(shù)據(jù)庫技術(shù)相結(jié)合的產(chǎn)物。KDD一詞是在1989年8月于美國底特律市召開的第一屆KDD國際學術(shù)會議上正式形成的。

知識發(fā)現(xiàn)被認為是從數(shù)據(jù)中發(fā)現(xiàn)有用知識的整個過程。數(shù)據(jù)開采被認為是KDD過程中的一個特定步驟,它用專門算法從數(shù)據(jù)中抽取模式。

數(shù)據(jù)開采的主要方法和技術(shù)有:信息論方法、集合論方法、仿生物技術(shù)、公式發(fā)現(xiàn)、統(tǒng)計分析方法及其它方法。

二、智能決策技術(shù)原理

篇9

ACM委員會于2011年3月10日公布,2010年度圖靈獎授予萊斯利•瓦里安特教授,表彰他在機器學習理論以及計算機科學諸多方面的奠基性貢獻。

2011年6月5日,在加州圣荷塞會議中心ACM召開的計算研究聯(lián)合大會FCRC 2011開幕日上,為萊斯利•瓦里安特舉辦了頒獎晚宴,獎金為25萬美元,仍由Intel和Google贊助。

1 學術(shù)生平

萊斯利•瓦里安特(Leslie Gabriel Valiant) 1949年3月28日生于英國。1970年在劍橋大學國王學院獲數(shù)學學士學位,1973年在倫敦帝國學院獲計算機科學畢業(yè)文憑,1974年獲華威克大學(University of Warwick)計算機科學博士學位。

1973年至1974年,萊斯利在卡內(nèi)基-梅隆大學作

訪問學者。1974年至1976年在里茲大學、1977年至1982年在愛丁堡大學、1982年至今在哈佛大學任教。從2001年起,擔任哈佛工程與應用科學學院計算機科學與應用數(shù)學的杰弗遜(T. Jefferson Coolidge)講席教授。他是英國皇家學會會員、美國科學院院士。

2 三大貢獻

萊斯利的第一個貢獻是在機器學習領(lǐng)域。1984年他在《ACM通訊》上發(fā)表了論文“習能力理論”(A Theory of the Learnable),在論文中提出了PAC模型,即“概率近似正確”(Probably Approximately Correct)的學習模型。PAC模型使20世紀50年代誕生的機器學習領(lǐng)域第一次有了堅實的數(shù)學基礎(chǔ),從而清除了學科發(fā)展的障礙,對于機器學習、人工智能和其他計算領(lǐng)域(如自然語言處理、手寫識別、機器視覺等)都產(chǎn)生了重要影響。該模型可解決信息分類問題,為此學習算法會根據(jù)過去的經(jīng)驗而設(shè)計一個概率假設(shè),并將此假設(shè)作為判斷依據(jù)。PAC模型可最大限度地降低泛化(Over-generalization)帶來的錯誤,這就是為什么它被稱為“概率近似正確”的原因。

萊斯利的第二個貢獻是在計算復雜性領(lǐng)域。1986年萊斯利和瓦茲拉尼在《理論計算機科學》上,題目是“NP同檢測唯一解一樣容易”(NP is as easy as detecting unique solutions),提出了瓦里安特-瓦茲拉尼定理(ValiantCVazirani theorem),合作者瓦茲拉尼(Vijay Virkumar Vazirani)是印度裔美國計算機科學家,佐治亞技術(shù)學院教授。

該定理可敘述為:UNIQUE-SAT  P  NP = RP。其中,SAT表示布爾可滿足性問題(Boolean Satisfiability Problem),指是否存在一組變量賦值,用來解決給定的布爾方程式。NP是“非確定性的多項式復雜程度”(Non-deterministic Polynomial)問題。

該定理的含義:如果UNIQUE-SAT 存在一個多項式時間算法P(polynomial time algorithm),那么NP=RP。這里的RP是隨機的多項式時間(randomized polynomial time),給出問題的復雜性類。該定理屬于決定性問題,是第一個被證明的NP完備問題。這個特性是概率圖靈機(Probabilistic Turing machine)特有的性質(zhì),它表明即使可滿足賦值數(shù)很小,SAT這個NP完備問題仍然是很難的問題。

萊斯利的第三個貢獻是在計算神經(jīng)學領(lǐng)域。1994年他在牛津大學出版社出版了《思維的電路》(Circuits of the Mind)一書,他為大腦設(shè)計了一個數(shù)學模型,并將它與復雜的認知功能建立了關(guān)聯(lián)。他在書中描述了一個稱為Neuroids的模型,支持廣泛的、多種多樣的、與記憶、學習、推理、搜索等相關(guān)的計算任務,不必使用更多資源就可以直接按神經(jīng)系統(tǒng)的方法完成這些任務。

此外,1979年他提出的上下文無關(guān)分析算法,至今仍是最快的算法之一。在并行與分布式計算領(lǐng)域,1990年他提出著名的BSP并行模型,至今仍是這一學科的基本文獻。

3 頒獎評語

ACM的頒獎詞高度評價了萊斯利•瓦里安特教授30年來對理論計算科學的基礎(chǔ)性工作。鑒于他“對眾多計算理論,包括PAC學習、枚舉復雜性、代數(shù)計算和并行與分布式計算所做的變革性的貢獻”而獲得2010年計算機科學最高榮譽圖靈獎。

他的工作開辟了新領(lǐng)域,給出了獨創(chuàng)的新概念,并提供了許多兼具原創(chuàng)性、深度和優(yōu)美的結(jié)果。他的工作一次又一次地確立或改變了計算科學的面貌。很少有人能像萊斯利那樣同時在廣度和深度上作出如此卓越的工作。他是理論計算機科學領(lǐng)域的真正英雄,他在解決某些懸而未決的科學問題上的勇氣和創(chuàng)造力是人們學習的楷模。圖1為頒獎晚會上的合影,左起為ACM CEO 約翰•懷特(John White)、Intel院士Shekar Borkar、谷歌副總裁Alfred Spector、圖靈獎得主萊斯利•瓦里安特、ACM總裁Alain Chesnais。

Intel院士、微處理器技術(shù)實驗室主任Shekar Borkar說:“瓦里安特教授在計算理論方面的研究使機器學習和人工智能發(fā)生了革命性的變化,使機器幾乎可以思維”,“他的研究方式堪與圖靈本人的媲美,從深邃洞察的基礎(chǔ)出發(fā),建立新穎的公式表述。Intel非常高興支持這個獎項”。

谷歌研究與創(chuàng)新副總裁Alfred Spector說:“瓦里安特教授的獨特概念和亮麗研究具有不可思議的廣度,他在機器學習領(lǐng)域完成了創(chuàng)新的發(fā)明,這是一個快速成長的、有許多重要應用的領(lǐng)域。我們?yōu)槌蔀锳CM圖靈獎的贊助者感到榮幸,這將激勵并辨別計算領(lǐng)域的巨大進步,給世界帶來美好的憧憬。”

4 光輝案例

眾所周知,1997年IBM的超級計算機“深藍”擊敗國際象棋大師卡斯帕羅夫,但是要讓計算機理解人類語言、像人類一樣思考就比下棋難多了。萊斯利的學習理論影響了IBM Watson的研制。IBM Watson系統(tǒng)是2006年開始設(shè)計的,它是由90臺IBM 750服務器組成的群集系統(tǒng),每臺服務器采用8核芯片的Power 7處理器,每核有4個線程,因此相當于有2880個核在運行。內(nèi)存16TB。采用的軟件有SUSE Linux Enterprise Server 11操作系統(tǒng)、IBM DeepQA軟件、Apache UIMA (非結(jié)構(gòu)化信息管理體系結(jié)構(gòu))框架等。該系統(tǒng)使用了上百種以上的技術(shù)來分析自然語言、識別資源、尋找并產(chǎn)生假設(shè)、尋找證據(jù)并評分、對假設(shè)進行聚集和分級,因此它是專門設(shè)計的具有學習能力的機器。

這個以IBM創(chuàng)始人托馬斯•J•沃森的名字命名的系統(tǒng),能儲存大量信息,相當于“100萬本書籍和2億頁資料”,還可以從經(jīng)驗中學習如何提高性能,并且使用自然語言回答問題。世界各地的研究人員歷時四年共同完成,其中我國科學家也為該項目做出了貢獻。該系統(tǒng)應用前景廣泛,它可以高速分析大量數(shù)據(jù),用來幫助政府部門解答公眾疑問,幫助醫(yī)生評估藥物療效等。圖2為2011年Jeopardy!競賽。

2011年2月14-16日,IBM Watson參加了美國智力競賽電視節(jié)目Jeopardy!(危險邊緣),該競賽1964年創(chuàng)立,問題涉及地理、政治、歷史、體育、娛樂等。通過難度相當大的考試后才能獲得參賽資格。在兩個回合比賽中,IBM Watson與該節(jié)目史上最出色的選手肯•詹寧斯和布拉德•魯特爾戰(zhàn)成一平一勝。

5 研究興趣

關(guān)于萊斯利•瓦里安特最近的研究興趣,他談道:計算機科學包括對人工現(xiàn)象和自然現(xiàn)象的研究。前者關(guān)注人造設(shè)備比如計算機;后者涉及大自然中多步驟或者計算的過程,比如腦或者生物進化過程。在大多數(shù)領(lǐng)域,對這些人工或者自然過程的終極局限還沒有很好的理解。計算設(shè)備的潛力目前還遠遠沒有認識清楚,而神經(jīng)科學與演化中基礎(chǔ)性的定量問題也沒有得到解答。他的研究主要將關(guān)注這些基本問題。

篇10

(邯鄲派瑞節(jié)能控制技術(shù)有限公司 河北 邯鄲 056000)

【摘 要】本文詳細地綜述了近年來微裝配技術(shù)的國內(nèi)外發(fā)展現(xiàn)狀以及其發(fā)展過程中面臨的一些關(guān)鍵技術(shù),并對微裝配的發(fā)展進行了展望。

關(guān)鍵詞 微機電系統(tǒng);微裝配;微夾持器;顯微視覺

1. 引言?

(1)自從20世紀80年代以來,微機電系統(tǒng)(MEMS)以飛快的速度發(fā)展成為一個集微型機械、微傳感器、微能源、微致動器、微控制器、微執(zhí)行器、信號處理、智能控制于一體的新興研究領(lǐng)域,如微型藥泵、微傳感器、微驅(qū)動器、微加速度計以及其他光電子醫(yī)學器件等。微機電系統(tǒng)(MEMS)如果按照外形尺寸大小可分為:1~10 mm的微小機械,1μm~1 mm的微機械以及1nm~1μm的納米機械。由于具有在狹小空間內(nèi)進行作業(yè)而有不擾亂工作環(huán)境和對象的特點,微機電系統(tǒng)的意義和應用將涉及航空航天、軍事、生物醫(yī)學工程、太空探險、深海探查等諸多領(lǐng)域。如果一旦技術(shù)上成熟并形成產(chǎn)業(yè)化,必將對國民經(jīng)濟建設(shè)、國防建設(shè)乃至社會發(fā)展產(chǎn)生深遠地影響,因此被譽為20世紀十大關(guān)鍵技術(shù)之首,21世紀最具代表性的技術(shù)。?

(2)微機電系統(tǒng)具有體積小、精度高、質(zhì)量輕、性能穩(wěn)定、可靠性高、能耗低、靈敏性和工作效率高、多功能和智能化、適合大批量生產(chǎn)、制造成本低廉等特點。其基本技術(shù)主要有微機械系統(tǒng)設(shè)計技術(shù)、復雜可動結(jié)構(gòu)微細加工(高深寬比多層微結(jié)構(gòu)加工)、微機械材料、微裝配和封裝、微操作、微測量、微系統(tǒng)的集成與控制、微宏接口等技術(shù)。微傳感器、微致動器、微控制器,是微系統(tǒng)的基礎(chǔ)單元。?

(3)隨著微機電系統(tǒng)技術(shù)的深入發(fā)展,微機械技術(shù)的研究已經(jīng)從基礎(chǔ)研究階段逐步發(fā)展到研制開發(fā)與實用階段,許多微傳感器、微執(zhí)行器和微光學部件已經(jīng)在許多行業(yè)獲得應用。國外也正在從微型機械電子系統(tǒng)向微型光機電系統(tǒng)方向發(fā)展和擴展,在尺寸上會向更微型化電子機械系統(tǒng)逼近。而且,這些微機電系統(tǒng)日趨復雜,其中許多包含了不同的材料或者需要經(jīng)過多種工序來實現(xiàn)。因此,針對微機電系統(tǒng)的微裝配和微操作的研究日益引起國內(nèi)外研究人員的高度重視。

2. 微裝配的國內(nèi)外發(fā)展概況?

(1)微裝配主要指對亞毫米尺寸(通常在幾μm~幾百μm之間)的零部件進行的裝配作業(yè)。目前針對微米級的操作和裝配問題,主要有2種解決方法:一是用帶有超精密控制系統(tǒng)的一般操作手和系統(tǒng),另一是將操作手微型化。利用集成電路工藝制造微裝配系統(tǒng)是未來發(fā)展的方向,但目前還有許多問題要解決。在傳統(tǒng)的宏觀技術(shù)上實現(xiàn)微裝配是目前許多學者研究的內(nèi)容,其系統(tǒng)類型大致分為遠端操作方式和自動操作方式。近年來,越來越多的微裝配領(lǐng)域的學者把注意力放在了自動微裝配系統(tǒng)的研究上。?

(2)鑒于微裝配系統(tǒng)技術(shù)的優(yōu)勢和廣闊的發(fā)展前景,各先進的工業(yè)化國家為了維持自身的競爭優(yōu)勢都對微機電系統(tǒng)技術(shù)表現(xiàn)出了足夠的重視,紛紛投入巨資開展研究。日本、德國和美國在微裝配系統(tǒng)的研究方面比較突出,已具有一定的成果。它們研制成功的微裝配系統(tǒng)大致可分為2類:一種是基于SEM的裝配系統(tǒng),另一種是基于傳統(tǒng)光學顯微鏡的裝配系統(tǒng)。前者具有放大倍數(shù)高、焦深大、分辨率高等特點,相比之下是一種理想的裝配方法,但其不足之處是操作復雜且設(shè)備昂貴。而后者則有操作簡單,成本低廉等優(yōu)點。美國在微裝配系統(tǒng)的開發(fā)研究方面取得了顯著的進展,他們利用AFM(原子力顯微鏡)和高精度反饋技術(shù),成功地感知了超光滑表面原子級尺寸的凹凸不平,同時還實現(xiàn)了原子遷移,展示了驚人的成就。?

(3)日本東京大學研制的納米機器人是由右腕、左腕和基座三部分組成,是在電子顯微鏡下工作的系統(tǒng)。右腕由壓電元件驅(qū)動3軸,左腕由粗動和壓電元件驅(qū)動3軸,基座有2軸機構(gòu)。其使用金剛石刀或用電解的鎢針作為工具,該納米機器人已做過LSI表面的鋁配線切斷實驗。?

(4)日本島津制作所研制的生物細胞微操作器,具有2套三軸粗動、微動的作業(yè)腕。粗動作業(yè)腕由步進電機驅(qū)動,微動作業(yè)腕由音圈電機驅(qū)動。?

(5)名古屋大學研制在血管中操作的有源導管,利用3個SMA(形狀記憶合金)細絲來控制前端的導向。瑞典Uppsala大學研制的微機器人也是在電子顯微鏡下工作的,該機器人有兩個作業(yè)腕,分別有4個和3個自由度。其工具為針狀的鑷子.利用該機器人已進行了切割200μm硅片、硅片熔接、制作硅單晶微型針等工作。?

(6)我國的微裝配系統(tǒng)的研究工作起步于九十年代初,10多年來,國家自然科學基金委員會、國家科技部、中國科學院、國家教育部、總裝備部和地方立了10余項與MEMs相關(guān)的重點和重大課題以及若干面上課題,總投資約1億元人民幣,其中也包括微裝配系統(tǒng)的研究。目前,清華大學、大連理工大學和中國科學院長春光學精密機械研究所、北京大學、上海交通大學、重慶大學、中國科技大學、中國科學院電子所、中國科學院半導體所、南開大學、東南大學、復旦大學、西安交通大學、哈爾濱工業(yè)大學、南京航空航天大學、北京航空航天大學、浙江大學、華中理工大學、中國科學院高能物理研究所、中國科學院力學所、中國科學院物理所、華東師范大學等,在微系統(tǒng)方面開展了微裝配裝置、生物細胞轉(zhuǎn)基因微操作系統(tǒng)、微型光譜儀、微電泳芯片及細小管道微機器人等研究工作。其中,上海交通大學在成功研制2 mm微動電機的基礎(chǔ)上,自建了一套微型裝配實驗系統(tǒng),主要是用來提供精密定位裝置的操作平臺;北京航空航天大學機器人研究所利用微機器人對微觀領(lǐng)域的操作技術(shù)開展了實驗研究;清華大學精密儀器與機械學系儀器科學與技術(shù)研究所自1996年以來從事微裝配技術(shù)與系統(tǒng)方面的實驗研究,并取得了一定的成果。這些工作都為真正的微裝配系統(tǒng)的構(gòu)建奠定了基礎(chǔ)。

3. 微裝配系統(tǒng)的關(guān)鍵技術(shù)?

隨著微加工技術(shù)、顯微技術(shù)和集成電路技術(shù)的發(fā)展,微裝配的概念發(fā)生了根本性的變化、產(chǎn)品的范圍和應用領(lǐng)域被拓寬,出現(xiàn)了許多新的技術(shù)。因此,微裝配技術(shù)的發(fā)展是與微機電系統(tǒng)(MEMS)、納米技術(shù)等相關(guān)技術(shù)密切相關(guān)。?

3.1 微裝配技術(shù)的發(fā)展階段。?

3.1.1 手工裝配。

經(jīng)過特殊培訓的操作技術(shù)人員可以手工裝配一些精密的光學和電磁器件。一些小型光纖、用于小型SCM的Electron Columns也在Illinois大學的微工藝應用實驗室手工裝配實現(xiàn)。但隨著零件的更加微形化,公差變得越來越小,手工裝配將受到很大局限。?

3.1.2 自動化的裝配。

為了減小操作者的勞動強度,降低微系統(tǒng)的制造成本,自動化的裝配是一個合適的選擇。例如:使用一個視覺和力混合的機械手在操作桿控制下實現(xiàn)多自由度運動,進行裝配工作。使用自動化裝配不僅使得裝配效率提高,而且可以進行批量裝配,降低裝配成本。微器件就是因為它體積小成本低才有廣闊的發(fā)展前途,因此自動化裝配應該是微裝配的發(fā)展目標。?

3.1.3 微機械手的裝配。

機械手因具有柔性好、操作靈活、能適應各種作業(yè)的特點,被廣泛應用于現(xiàn)代工業(yè)中。微裝配要求較高的定位精度,就必須使得微機械手有高的制造精度,零件的公差必須被限制在納米范圍內(nèi)。目前,使用微機械手以及微機器人進行微裝配是研究的主要方向。?

3.2 微裝配中的視覺技術(shù)。?

(1)微裝配的部件尺寸大多在幾μm~幾百μm之間,對于裝配精度的要求就需要提高,通常為亞微米級。由于這個精度要求已經(jīng)超出了一般工業(yè)應用的開環(huán)精密裝配系統(tǒng)的標定精度,那么在微裝配中使用精確的閉環(huán)定位系統(tǒng)是必要的。因此,對于微裝配系統(tǒng),視覺系統(tǒng)作為其柔性反饋系統(tǒng),所具備的功能應該能夠滿足裝配的要求。?

(2)目前顯微視覺研究主要集中在大學和科研單位。美國加利福尼亞大學研制了使用AFM的顯微視覺系統(tǒng)進行微裝配中高精度定位研究;美國麻省理工大學利用光聚焦顯微鏡、機器視覺技術(shù)和圖象處理開發(fā)了可靠和廉價的MEMS測試系統(tǒng);德國斯圖加特大學,利用SLM雙目立體成像的特點研究了SLM條紋投影系統(tǒng);韓國科技學院研發(fā)出三目立體視覺的微機器人,主要應用于微夾持、微裝配和微操作等領(lǐng)域。在國內(nèi),南京航空航天大學、北京航空航天大學、哈爾濱工業(yè)大學機器人研究所和清華大學都開展了與顯微視覺相關(guān)的研究。?

(3)通過目前國內(nèi)外的研究情況來看,顯微視覺的研究方向主要集中在視覺信息獲取和視覺引導、位置和運動的自動控制以及力的傳感和控制。前者是微操作系統(tǒng)的基礎(chǔ),因此是目前研究的熱點。其研究重點是基于平面顯微圖象的視覺引導和基于立體顯微圖象的視覺引導。?

3.3 微夾持器。?

(1)微裝配過程中微夾持器的合理設(shè)計和制造是一個關(guān)鍵環(huán)節(jié)。由于微夾持器不僅需要滿足微操作條件下復雜的力不確定性,而且必須具有一定的自由度以滿足各種不同操作。在微夾持器設(shè)計上,靈活抓取目標必需的運動學要求、穩(wěn)定和安全抓取的力要求、傳感和驅(qū)動方式以及可控性等特點是必須考慮的。?

(2)微夾持器是一種典型的微執(zhí)行機構(gòu),它在微機械零件加工、微機械裝配和生物工程等方面部有較好的應用前景,近來發(fā)展十分迅速。目前,按驅(qū)動力類型不同,見表1,已經(jīng)研制出靜電力驅(qū)動、電磁力驅(qū)動、功能材料驅(qū)動的種類眾多的微小尺度操作和微小尺寸的夾鉗,其中一些已研究成功,體現(xiàn)出現(xiàn)時和潛在的應用價值。?

(3)微夾持器的制作技術(shù)主要有:一是基于傳統(tǒng)工藝技術(shù),如:Shimada等人采用了一種應用傳統(tǒng)工藝制成的單自由度微夾持器;另一是LIGA(Lithographic Galvan forming Ab-formung)技術(shù),如Carrozza等制作了一種以鎳為基,表面覆蓋金的微夾持器厚度只有200μm。該工藝首先使用同步加速器產(chǎn)生的軟X射線,通過掩摸照射在光敏聚合物上留下部件的立體模型,再提高電場將金屬遷移形成金屬結(jié)構(gòu)。在此基礎(chǔ)上又出現(xiàn)了不需要昂貴的同步輻射X光源的準LIGA技術(shù),并且與集成電路工藝有更好的兼容性。?

3.4 微驅(qū)動技術(shù)。

驅(qū)動技術(shù)也是微操作和微裝配領(lǐng)域的關(guān)鍵技術(shù)之一。它不僅要求有非常好的響應特性,而且還有工作空間和部件尺寸的限制。國內(nèi)外研究人員把許多基礎(chǔ)效應和新型材料應用到微驅(qū)動和精確定位上,做了大量的工作。如壓電材料、靜電材料、電磁材料以及形狀記憶材料等。目前應用的最廣泛的還是壓電效應技術(shù),如Carrozza等的微夾持器由壓電材料驅(qū)動。

4. 微裝配技術(shù)發(fā)展展望?

4.1 微裝配技術(shù)的研究從90年代初始到現(xiàn)在,已有10余年的時間,并且在這10年里取得了長足的進步,但隨著微細加工技術(shù)等半導體集成電路工藝的發(fā)展,微裝配和微操作技術(shù)中一些不足之處也將日益顯示。主要在微裝配系統(tǒng)中各個關(guān)鍵技術(shù)的研究還不夠,如視覺反饋手段、微夾持手的設(shè)計、控制以及驅(qū)動方式等方面都還有許多問題沒有得到完全解決。微裝配技術(shù)研究的最終目標是實現(xiàn)微器件的全自動裝配操作,但到目前為止,這一目標還仍未能實現(xiàn),其主要原因有以下三方面:

(1)微器件操作的許多關(guān)鍵技術(shù)還未被完全掌握;(2)微觀領(lǐng)域中出現(xiàn)的特殊現(xiàn)象及其物理機制仍需不斷深入研究探討,如微機械粘附等;(3)簡便、廉價的微器件加工設(shè)備沒有得到開發(fā),這也是由于微裝配技術(shù)、策略等多方面因素所致。?

4.2 未來的發(fā)展方向應當是融合微電子、材料、機械、計算機等多學科技術(shù)來解決微觀領(lǐng)域的問題。

參考文獻

[1] 溫詩鑄;李娜微型機械與納米機械學研究[J].中國機械工程,1996(02).

[2] SHIMADA E;YAN J;WOOD R Prototyping millirobots dextrous micro-assembly and folding 2000.

[3] CARROZZA M C;DARIO P;MENCIASSI A Manipulating biological and mechanical micro-obiects ising LIGAmicrofabricated end-effectors[J] 1998.

[4] 席文明;吳洪濤;朱劍英裝配技術(shù)的發(fā)展現(xiàn)狀[J].機械科學與技術(shù) 2002(06).