www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

技術(shù)筆記系列 - SAN存儲(chǔ)的長鏈條

2018-02-06 09:25:38 行禪與一心走路  點(diǎn)擊量: 評(píng)論 (0)
十幾年前學(xué)習(xí)DOS內(nèi)核的時(shí)候,是可以直接寫程序控制磁盤步進(jìn)電機(jī)的,磁頭放在什么位置,讀寫到盤片的哪兒都可以控制。但看看現(xiàn)在的SAN存儲(chǔ),

十幾年前學(xué)習(xí)DOS內(nèi)核的時(shí)候,是可以直接寫程序控制磁盤步進(jìn)電機(jī)的,磁頭放在什么位置,讀寫到盤片的哪兒都可以控制。但看看現(xiàn)在的SAN存儲(chǔ),恍若已是隔世。
我們就以一條簡單的linux cat 讀文件命令,看看要經(jīng)歷怎樣的千山萬水,才能到達(dá)物理磁盤,取到真正的數(shù)據(jù)。
首先,在linux 命令行中輸入cat 命令,系統(tǒng)會(huì)調(diào)用相應(yīng)的system call, 進(jìn)入內(nèi)核態(tài)。在內(nèi)核里最早接受請求的是VFS(virtual file system)層, VFS 是一層抽象的文件接口,當(dāng)它發(fā)現(xiàn)實(shí)際請求是要訪問一個(gè)磁盤文件時(shí),就會(huì)調(diào)用對應(yīng)的真正的文件系統(tǒng)接口,在linux中通常是Ext3. 在這個(gè)時(shí)候,如果該文件之前已經(jīng)被讀過,還放在buffer 中,那么恭喜你,你可以直接拿到數(shù)據(jù)了。

技術(shù)筆記系列 - SAN存儲(chǔ)的長鏈條

如果沒有,對不起,繼續(xù)往下調(diào)用塊設(shè)備存儲(chǔ)的驅(qū)動(dòng),塊設(shè)備存儲(chǔ)驅(qū)動(dòng)會(huì)把讀取文件的指令轉(zhuǎn)換成讀取某個(gè)塊存儲(chǔ)設(shè)備的某個(gè)數(shù)據(jù)塊,這也是SCSI子系統(tǒng)的最高層接口,系統(tǒng)把存取指令按照SCSI協(xié)議命令打包,發(fā)給SCSI 控制器。如果linux是非虛擬機(jī),這個(gè)時(shí)候工作就交給硬件。
但是,如果linux還是臺(tái)虛擬機(jī)(現(xiàn)在大部分情況都是這樣,假設(shè)這臺(tái)linux是運(yùn)行在Vmware 的 EXSi host 上),讀取指令則會(huì)傳遞給一個(gè)虛擬的SCSI 控制器,這個(gè)虛擬SCSI控制器再傳遞給VMkernel, 對VMkernel而言,虛擬機(jī)的一個(gè)磁盤其實(shí)只是一個(gè)文件(datastore), 所以VMkernel還要二次轉(zhuǎn)換,轉(zhuǎn)成物理設(shè)備真正的位置,再把這些指令通過調(diào)用HBA驅(qū)動(dòng)發(fā)給HBA卡。
HBA卡(host bus adapter)是光傳輸設(shè)備,它與光交換機(jī),SAN存儲(chǔ)一起構(gòu)成光纖傳輸網(wǎng)絡(luò),把讀取指令傳輸?shù)较鄳?yīng)的存儲(chǔ)設(shè)備上。
好,總算到目的地了。且慢,這還是萬里長征第一步,現(xiàn)在的SAN存儲(chǔ)可不僅僅是幾塊磁盤,就拿IBM8870來說,它其實(shí)是由兩臺(tái)高端P系列服務(wù)器組成的集群。當(dāng)我們的讀取指令到達(dá)SAN 存儲(chǔ),SAN存儲(chǔ)會(huì)重新解析這些指令,如果該數(shù)據(jù)塊已經(jīng)放在存儲(chǔ)服務(wù)器龐大的內(nèi)存(Cache)中,則這些數(shù)據(jù)就會(huì)經(jīng)光傳輸網(wǎng)絡(luò)返回。否則,就要遍歷在linux端同樣的過程,一級(jí)一級(jí)調(diào)用底層接口,最后通過SCSI驅(qū)動(dòng),發(fā)出指令來操作實(shí)際的物理硬盤。
在這個(gè)過程中,存儲(chǔ)服務(wù)器已經(jīng)將數(shù)據(jù)的具體物理位置做了兩層封裝。首先是做RAID,比如IBM8870 中8個(gè)盤為一組,用RAID5,6,或10,實(shí)現(xiàn)數(shù)據(jù)冗余和高性能。所以看似連續(xù)的數(shù)據(jù)塊實(shí)際可能分布在一組磁盤上。第二層是extend pool, IBM8870可以將SSD盤,SAS盤,SATA 盤都放到同一個(gè)extend pool, 再分到同一個(gè)邏輯盤里。也就是說我們操作的邏輯盤其實(shí)際數(shù)據(jù)可能放在完全不同類型的盤中,而且,由于IBM78870提供了自動(dòng)Easy tier 功能,系統(tǒng)可以根據(jù)數(shù)據(jù)的使用頻率調(diào)整使用不同的盤。如果某數(shù)據(jù)塊頻繁地被訪問,則該數(shù)據(jù)塊就會(huì)從 SAS盤轉(zhuǎn)到SSD盤 。所有這一切都是自動(dòng)在后臺(tái)進(jìn)行,對用戶完全不可見。
現(xiàn)在還有一項(xiàng)流行的技術(shù),就是在服務(wù)器和物理存儲(chǔ)系統(tǒng)間再嵌入一層虛擬層,由它來管理控制所有存儲(chǔ)并對服務(wù)器提供存儲(chǔ)服務(wù)。比如IBM SVC (storage volume controller). linux 發(fā)出的數(shù)據(jù)讀取指令會(huì)先到SVC, SVC 實(shí)質(zhì)也是一臺(tái)服務(wù)器,同時(shí)對各物理存儲(chǔ)系統(tǒng)的盤有做了一層封裝。所有連SVC 的存儲(chǔ)系統(tǒng)將自己的磁盤呈現(xiàn)給 SVC組成 MDG (managed disk group),SVC 再將這些盤映射為自己的 VDISK. 當(dāng)用戶需要讀取某VDISK 中的數(shù)據(jù)時(shí),SVC再翻譯成對應(yīng)的實(shí)際物理存儲(chǔ)系統(tǒng)的的位置,然后通知該物理存儲(chǔ)系統(tǒng)讀取相應(yīng)的數(shù)據(jù)。
我們可以看到,現(xiàn)代基于 SAN 的存儲(chǔ)系統(tǒng)其實(shí)已經(jīng)對物理磁盤做了多層封裝和虛擬化。在用戶這一層幾經(jīng)無法實(shí)際定位某一段數(shù)據(jù)真正放在物理磁盤上的哪個(gè)位置。

 

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:任我行

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
?
主站蜘蛛池模板: 99视频在线播放 | 波多野结衣中文视频 | 欧美国产精品一区二区免费 | 手机看片神马午夜 | 中文字幕福利视频 | 在线精品免费视频 | 久草国产在线视频 | 亚洲综合久久1区2区3区 | 日韩在线视频中文字幕 | 另类专区另类专区亚洲 | 午夜国产高清精品一区免费 | 欧美三级视频在线观看 | 欧美一级毛片aaa片 欧美一级毛片不卡免费观看 | 中文字幕亚洲区 | 激情午夜天 | 一级毛片观看 | 久久女同互慰一区二区三区 | 日本一本黄 | 日韩欧美一区二区三区在线观看 | 欧美91精品久久久久网免费 | 精品中文字幕在线观看 | 91青草久久久久久清纯 | 青青草色久综合网 | 一级做a爰 | 免费国产成人高清在线看软件 | 色多多最新地址福利地址 | 成人免费观看一区二区 | 欧美精品三级在线 | 欧美一级特黄刺激爽大片 | 国产精品hd在线播放 | 夜色福利久久久久久777777 | julia中文字幕久久亚洲 | aaa毛片手机在线现看 | 日韩免费观看一级毛片看看 | pgone太大了兽王免费视频 | 美国毛片亚洲社区在线观看 | 欧美一级毛片在线播放 | 中文字幕久久亚洲一区 | 国内自拍2020 | 国产一区二区三区四区五区 | 国产资源精品一区二区免费 |