基于內(nèi)容的圖像檢索研究
摘 要:多媒體信息化技術(shù)的發(fā)展使得基于內(nèi)容的圖像檢索變得更加便捷、精確、高效,基于內(nèi)容的圖像檢索是根據(jù)圖像的特征進(jìn)行信息提取,進(jìn)而用于檢索,顏色、紋理和形狀是圖像內(nèi)容的組成要素。筆者根據(jù)工作經(jīng)驗(yàn),
摘 要:多媒體信息化技術(shù)的發(fā)展使得基于內(nèi)容的圖像檢索變得更加便捷、精確、高效,基于內(nèi)容的圖像檢索是根據(jù)圖像的特征進(jìn)行信息提取,進(jìn)而用于檢索,顏色、紋理和形狀是圖像內(nèi)容的組成要素。筆者根據(jù)工作經(jīng)驗(yàn),將從常見(jiàn)的圖像檢索系統(tǒng)分析著手,研究圖像內(nèi)容元素,并就基于內(nèi)容的圖像檢索應(yīng)用進(jìn)行探討,為相關(guān)的研究提供參考性的建議。
關(guān)鍵詞:內(nèi)容 圖像檢索 特征
隨著計(jì)算機(jī)信息技術(shù)的快速發(fā)展,多媒體數(shù)據(jù)日益豐富,而對(duì)圖像的有效檢索成為了熱門(mén)的課題,尤其是計(jì)算機(jī)視覺(jué)和數(shù)據(jù)庫(kù)系統(tǒng)的研究深入推動(dòng)著圖像檢索的發(fā)展,主要有基于內(nèi)容和基于文本的技術(shù),給圖像檢索帶來(lái)了積極的意義。基于文本的圖像檢索出現(xiàn)較早,但由于不同人對(duì)同一圖像的主觀理解有很大的偏差,存在著二義性,使得圖像檢索存在著精確性的問(wèn)題,基于內(nèi)容的圖像檢索隨之出現(xiàn)。基于內(nèi)容的基本方法是在建立圖像庫(kù)時(shí),從圖像中提取圖像目標(biāo)的特征,并將與之對(duì)應(yīng)的特征向量存入圖像庫(kù),在圖像檢索時(shí),圖像特征向量被提取出來(lái),與圖像庫(kù)中的特征向量進(jìn)行相似度的匹配,得到圖像檢索的結(jié)果。圖像的特征是檢索的基礎(chǔ),廣義上而言,特征的提取包括視覺(jué)特征和文本特征,但在圖像中提取文本的技術(shù)尚不成熟,而圖像視覺(jué)的特征提取發(fā)展到一定水平,通過(guò)使用最為可靠的視覺(jué)特征,如顏色、紋理和形狀等特征,對(duì)每一種視覺(jué)特征而言,通過(guò)不同的角度模擬人類感知,將這些特征應(yīng)用與圖像檢索的表達(dá)。論文結(jié)合筆者工作經(jīng)驗(yàn),將從圖像檢索系統(tǒng)、圖像內(nèi)容、應(yīng)用等方面進(jìn)行分析,為相關(guān)研究做出一定的貢獻(xiàn)。
1 常見(jiàn)的圖線檢索系統(tǒng)介紹
從上世紀(jì)90年代以來(lái),基于內(nèi)容的圖像檢索技術(shù)就已經(jīng)成為了熱門(mén)的研究方向,當(dāng)前有多種比較著名的圖像檢索系統(tǒng),以下做簡(jiǎn)要的分析概述。
1.1 Virage圖像檢索系統(tǒng)
由Virage公司基于內(nèi)容開(kāi)發(fā)的,支持顏色、紋理、結(jié)構(gòu)等可視化信息的查詢,也可以是上述的各特征信息的任意組合,根據(jù)用戶自己的喜好調(diào)整這些元素的組合。
1.2 QBIC圖像檢索系統(tǒng)
QBIC是IBM基于內(nèi)容開(kāi)發(fā)的圖像檢索系統(tǒng),其系統(tǒng)的框架具有開(kāi)創(chuàng)性,對(duì)其后的圖像檢索系統(tǒng)有深遠(yuǎn)的影響,基于選擇的顏色、例子圖像、用戶構(gòu)造的略圖、紋理等查詢,顏色特征有平均坐標(biāo)進(jìn)和K個(gè)元素的直方圖,紋理特征在對(duì)比度、粗糙度和方向等進(jìn)行結(jié)合,形狀包括圓形度、面積、偏心度、主軸偏向等,QBIC的圖像檢索是第一個(gè)商品化的基于內(nèi)容的圖像檢索系統(tǒng),雖然功能有待完善,但影響深遠(yuǎn)。
1.3 RetrievalWare圖像檢索系統(tǒng)
是由Excalibur公司開(kāi)發(fā)的基于內(nèi)容的檢索系統(tǒng),其重點(diǎn)在于圖像檢索系統(tǒng)中的神經(jīng)網(wǎng)絡(luò)化,通過(guò)對(duì)圖像特征的形狀、紋理、亮度、顏色、顏色分割等進(jìn)行特征查詢,并且可以迎合用戶的側(cè)重,對(duì)上述的特征量進(jìn)行組合,類似于Virage檢索,其最大的區(qū)別在于使用了神經(jīng)網(wǎng)絡(luò)的技術(shù)。
1.4 VisualSEEK和WebSEEK圖像檢索系統(tǒng)
VisualSEEK是面向視覺(jué)特征的搜索工具,而WebSEEK則是面向文本/圖像的搜索工具。WebSEEK面向Web,主要包含三個(gè)模塊,主題分類和索引模塊、圖像/視頻收集模塊、搜索瀏覽和檢索模塊,主要是基于視覺(jué)內(nèi)容和關(guān)鍵字的查詢;VisualSEEK研究空間和圖像區(qū)域的關(guān)系,從壓縮域中抽取視覺(jué)特性,如基于小波變換的紋理特征、顏色集等;同時(shí),采用二叉樹(shù)的索引方式又可以提升檢索的速度。
1.5 MARS圖像檢索系統(tǒng)
這種圖像檢索系統(tǒng)與其他幾類有著明顯的區(qū)別,其融合了信息檢索、計(jì)算機(jī)視覺(jué)和數(shù)據(jù)庫(kù)管理系統(tǒng)多個(gè)交叉領(lǐng)域,其特點(diǎn)是檢索與索引聯(lián)結(jié)、帶ranked的精確檢索匹配、人機(jī)結(jié)合等。MARS的關(guān)鍵不在于尋找單一的特征表達(dá),而是將視覺(jué)特征的不同元素組合,可以動(dòng)態(tài)的使用不同用戶的需求,并在檢索中提出反饋機(jī)構(gòu),包括自動(dòng)在線匹配、自動(dòng)特征適應(yīng)和查詢矢量?jī)?yōu)化等,檢索的機(jī)制非常獨(dú)到。
2 內(nèi)容分析
2.1 顏色特征
作為圖像內(nèi)容中最為直觀的要素,顏色是用戶獲取信息最快捷的方式,利用顏色進(jìn)行圖像檢索其核心思想是在顏色空間中對(duì)顏色出現(xiàn)的頻數(shù)進(jìn)行分析,涉及到顏色空間量化、顏色空間的選取、顏色直方圖定義、顏色空間的距離定義等。在檢索系統(tǒng)總,為了能夠正確的辨別和使用顏色,需要建立顏色的模型。一般將顏色在3D坐標(biāo)系中用空間點(diǎn)表示出來(lái),在不同的場(chǎng)景中,圖像的顏色表示方法也有較大的區(qū)別。以RGB模型為例,基于笛卡爾坐標(biāo)系統(tǒng),坐標(biāo)軸分別為R、G、B,從原點(diǎn)到離原點(diǎn)最遠(yuǎn)定點(diǎn)間的連線上有黑白分布的灰度值,并且將顏色值都進(jìn)行了標(biāo)準(zhǔn)化,每幅圖像都包括三個(gè)獨(dú)立的基色平面,可以方便的顯示圖像,以圖1為例。

而采用顏色直方圖可以有效的將圖像信息刻畫(huà)出來(lái),從概率上而言,顏色直方圖反映顏色通道的聯(lián)合概率,其特點(diǎn)是圖像中包含了某種顏色出現(xiàn)的概率,并將之?dāng)?shù)值化,但不包含像素的空間信息。對(duì)于任意的一幅圖像都可以有對(duì)應(yīng)的直方圖。顏色特征是最可靠的視覺(jué)元素,直方圖也是最為常用的表述顏色特征的方式,不但簡(jiǎn)單便捷,而且對(duì)變比例、平移和旋轉(zhuǎn)等具有固定性,直方圖將整個(gè)圖像劃分為若干個(gè)區(qū)域,每一個(gè)區(qū)域中提取對(duì)應(yīng)的顏色特征,然后經(jīng)過(guò)區(qū)域之間的加權(quán)和,對(duì)應(yīng)區(qū)域的相似度。人們?cè)诒容^兩幅圖時(shí)并不是比較對(duì)應(yīng)區(qū)域的相似性,而是A圖中的某一子塊在B圖中是否也出現(xiàn)了,采用交叉相似的度量手段,提取圖像中最為接近的子塊,最終加權(quán)和作為兩幅圖像的最終相似度。
2.2 紋理特征
紋理容易讓人們聯(lián)想到木質(zhì)家具、衣服花紋等,其反映了物體表面的灰度和顏色等變化,和物體本身的屬性直接相關(guān),人們?cè)谕ㄟ^(guò)識(shí)別紋理特征來(lái)區(qū)分圖像,就如同在整個(gè)森林中,不同樹(shù)木的紋理是有著區(qū)別的。但是由于紋理是非線性的變化量,難以經(jīng)過(guò)硬性規(guī)定,難以給出確切的定義。紋理特征的三個(gè)主要標(biāo)志分別是:其一,序列是由基本部分非隨機(jī)排序的;其二,某種局部的特征不斷重復(fù)排序;其三,統(tǒng)一材質(zhì)或圖像的表面其紋理特征的表現(xiàn)大體上是一致的,有大體相同的尺寸結(jié)構(gòu),被稱為紋理基元。因而,在分析紋理特征時(shí),應(yīng)該是按照基元規(guī)律性的排列組合而成的。紋理在圖像中時(shí)一個(gè)重要的特征,如醫(yī)學(xué)顯微圖像、衛(wèi)星遙感圖像、金相組織等都具有不同的紋理,在描述時(shí),需要進(jìn)行分割。在紋理特征的提取和描述過(guò)程中,一般有結(jié)構(gòu)法、統(tǒng)計(jì)法和頻譜分析法。由于紋理在空間上是反復(fù)形成的,兩像素之間會(huì)存在一定的灰度關(guān)系,即灰度的空間相關(guān)特性,運(yùn)用灰度級(jí)空間相關(guān)性的規(guī)律,可以很好的對(duì)圖像紋理特征進(jìn)行描述。
2.3 形狀特征
形狀是圖像的顯著特征,同一物體可以有不同的顏色,但其形狀非常接近,如汽車,有多種顏色,但形成具有典型的特征,其輪廓或者說(shuō)原理非常接近。在二維的圖像空間中,形狀是一條封閉曲線圍成的區(qū)域,形成了一種輪廓,當(dāng)前基于形狀特征的圖像檢索大多依靠外形輪廓來(lái)進(jìn)行區(qū)分。形狀特征的描述有樣條擬合曲線、直線段、傅里葉描述和高斯曲線等,在圖像檢索的過(guò)程中,通過(guò)計(jì)算形狀矩和直方圖的加權(quán)距離來(lái)區(qū)分圖像的形狀。形狀特征區(qū)域主要有區(qū)域的面積、形狀的無(wú)關(guān)矩、形狀的縱橫比等。利用形狀描述符,如偏心率、形狀參數(shù)、球狀性、圓形性等對(duì)形狀的特征進(jìn)行描述。
3 基于內(nèi)容的圖像檢索研究
3.1 系統(tǒng)模塊
基于內(nèi)容的圖像檢索系統(tǒng)模塊有系統(tǒng)主界面、圖像處理、檢索設(shè)置、檢索結(jié)果顯示等部分組成。系統(tǒng)主界面用于顯示當(dāng)前的圖像、對(duì)圖像庫(kù)進(jìn)行操作等,可以進(jìn)行圖像的瀏覽、刪除等操作,包括圖像入庫(kù)、圖像檢索、BMP文件的存入、圖像序號(hào)顯示等功能;圖像處理基于圖像處理模塊,服務(wù)于圖像檢索,包含的功能有將顏色直方圖轉(zhuǎn)換為灰度圖像、計(jì)算灰度共生矩陣、統(tǒng)計(jì)特征值等,與專業(yè)的軟件結(jié)合使用,揚(yáng)長(zhǎng)避短;檢索設(shè)置有當(dāng)前打開(kāi)的圖像,可以進(jìn)行存儲(chǔ)位置、圖像的顯示比例、全局顏色直方圖、分塊顏色直方圖等設(shè)置,顯示檢索的盡速和結(jié)果瀏覽對(duì)話框;而檢索結(jié)果顯示的每一幅圖像結(jié)果下有一個(gè)信息條,從上到下的相似性逐漸降低,顯示圖像在庫(kù)中的ID和圖像實(shí)際的尺寸。
3.2 基于內(nèi)容的圖線檢索實(shí)現(xiàn)
基于內(nèi)容的圖像檢索是在特征提取的前提下,完成一個(gè)目標(biāo)的模型描述,一是建立圖像特征內(nèi)容的數(shù)據(jù)模型,而是對(duì)模型進(jìn)行描述。圖像內(nèi)容按照不同的語(yǔ)義級(jí)別,建立多層數(shù)據(jù)模型,第一層為存儲(chǔ)層,對(duì)圖像內(nèi)容特征進(jìn)行格式存儲(chǔ)、編碼,是最底層的信息描述;第二層為底層特征層,包含紋理、形狀、顏色等特征,針對(duì)每一種圖像特征的表示方法有所區(qū)別,按照第一層的定義進(jìn)行描述;第三層為圖像對(duì)象層,分析底層特征,運(yùn)用圖像識(shí)別技術(shù)提取獨(dú)立的圖像對(duì)象,建立語(yǔ)義描述和圖像的定位描述;第四層為圖像語(yǔ)義層,建立在圖像內(nèi)容的完整意義上的概念描述;最后一層為附加信息層,雖然信息和圖像內(nèi)容無(wú)直接的關(guān)聯(lián),但可以進(jìn)行圖像檢索的信息、圖像制作時(shí)間等記錄。
4 結(jié)語(yǔ)
基于文本的圖像檢索技術(shù)當(dāng)面對(duì)用戶主觀理解具有較大差異的時(shí)候,其檢索的效果往往并不理想,也不能適應(yīng)用戶對(duì)圖像檢索的某些需求,因而基于內(nèi)容的圖像檢索技術(shù)應(yīng)運(yùn)而生,通過(guò)對(duì)圖像最為直觀的特征,如顏色、形狀、紋理等進(jìn)行描述,可以較為直觀、準(zhǔn)確、快速的迎合用戶的檢索需求,基于內(nèi)容的圖像檢索也取得了長(zhǎng)足的進(jìn)步。但此類技術(shù)在應(yīng)用中仍然有待完善,隨著技術(shù)的進(jìn)步,基于文本、基于內(nèi)容和基于語(yǔ)音等技術(shù)的交叉融合性越來(lái)越強(qiáng),取得的效果明顯會(huì)優(yōu)于單一的檢索方式,各種檢索技術(shù)之間取長(zhǎng)補(bǔ)短,成為未來(lái)發(fā)展的趨勢(shì),研究值得深入。

責(zé)任編輯:葉雨田
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
-
現(xiàn)貨模式下谷電用戶價(jià)值再評(píng)估
2020-10-10電力現(xiàn)貨市場(chǎng),電力交易,電力用戶 -
PPT | 高校綜合能源服務(wù)有哪些解決方案?
2020-10-09綜合能源服務(wù),清潔供熱,多能互補(bǔ) -
深度文章 | “十三五”以來(lái)電力消費(fèi)增長(zhǎng)原因分析及中長(zhǎng)期展望
2020-09-27電力需求,用電量,全社會(huì)用電量
-
PPT | 高校綜合能源服務(wù)有哪些解決方案?
2020-10-09綜合能源服務(wù),清潔供熱,多能互補(bǔ) -
深度文章 | “十三五”以來(lái)電力消費(fèi)增長(zhǎng)原因分析及中長(zhǎng)期展望
2020-09-27電力需求,用電量,全社會(huì)用電量 -
我國(guó)電力改革涉及的電價(jià)問(wèn)題
-
電化學(xué)儲(chǔ)能應(yīng)用現(xiàn)狀及對(duì)策研究
2019-08-14電化學(xué)儲(chǔ)能應(yīng)用 -
《能源監(jiān)測(cè)與評(píng)價(jià)》——能源系統(tǒng)工程之預(yù)測(cè)和規(guī)劃
-
《能源監(jiān)測(cè)與評(píng)價(jià)》——能源系統(tǒng)工程之基本方法
-
貴州職稱論文發(fā)表選擇泛亞,論文發(fā)表有保障
2019-02-20貴州職稱論文發(fā)表 -
《電力設(shè)備管理》雜志首屆全國(guó)電力工業(yè) 特約專家征文
2019-01-05電力設(shè)備管理雜志 -
國(guó)內(nèi)首座蜂窩型集束煤倉(cāng)管理創(chuàng)新與實(shí)踐
-
人力資源和社會(huì)保障部:電線電纜制造工國(guó)家職業(yè)技能標(biāo)準(zhǔn)
-
人力資源和社會(huì)保障部:變壓器互感器制造工國(guó)家職業(yè)技能標(biāo)準(zhǔn)
-
《低壓微電網(wǎng)并網(wǎng)一體化裝置技術(shù)規(guī)范》T/CEC 150
2019-01-02低壓微電網(wǎng)技術(shù)規(guī)范
-
現(xiàn)貨模式下谷電用戶價(jià)值再評(píng)估
2020-10-10電力現(xiàn)貨市場(chǎng),電力交易,電力用戶 -
建議收藏 | 中國(guó)電價(jià)全景圖
2020-09-16電價(jià),全景圖,電力 -
一張圖讀懂我國(guó)銷售電價(jià)附加
2020-03-05銷售電價(jià)附加