聚類(lèi)分析翻譯多少錢(qián)-什么是聚類(lèi)分析?
日期:2023-03-11 12:39:36 / 人氣: 1038 / 發(fā)布者:成都翻譯公司
聚類(lèi)分析翻譯了多少:什么是聚類(lèi)分析?類(lèi)將目標(biāo)數(shù)據(jù)放入少數(shù)相對(duì)同源的組或“集群”中。分析表達(dá)數(shù)據(jù),(1)通過(guò)一系列檢驗(yàn)將一組待測(cè)基因的變異標(biāo)準(zhǔn)化,然后成對(duì)比較線(xiàn)性協(xié)方差。 (2) 樣本聚類(lèi),將譜系*密切的基因放在一起,例如,使用簡(jiǎn)單的層次聚類(lèi)方法。這種聚類(lèi)也可以擴(kuò)展到每個(gè)實(shí)驗(yàn)樣本,使用一組基因的總線(xiàn)性相關(guān)性聚類(lèi)分析翻譯了多少:什么是聚類(lèi)分析?
類(lèi)將目標(biāo)數(shù)據(jù)放入少數(shù)相對(duì)同源的組或“集群”中。分析表達(dá)數(shù)據(jù),(1)通過(guò)一系列檢驗(yàn)將一組待測(cè)基因的變異標(biāo)準(zhǔn)化,然后成對(duì)比較線(xiàn)性協(xié)方差。 (2) 樣本聚類(lèi),將譜系*密切的基因放在一起,例如,使用簡(jiǎn)單的層次聚類(lèi)方法。這種聚類(lèi)也可以擴(kuò)展到每個(gè)實(shí)驗(yàn)樣本,使用一組基因的總線(xiàn)性相關(guān)性進(jìn)行聚類(lèi)。 (3)多維尺度分析(MDS)是一個(gè)二維歐氏“距離”,表示實(shí)驗(yàn)樣本的近似相關(guān)程度。 (4) K-means method clustering,一種通過(guò)重復(fù)重新分配類(lèi)成員來(lái)*小化一個(gè)“類(lèi)”內(nèi)分散程度的方法。
聚類(lèi)方法有兩個(gè)明顯的局限性:第一、為了使聚類(lèi)結(jié)果清晰,需要分離良好的數(shù)據(jù)。幾乎所有現(xiàn)有算法都從不同的非重疊類(lèi)數(shù)據(jù)生成相同的集群。但是,如果類(lèi)是分散的和相互滲透的,則每種算法的結(jié)果都會(huì)有些不同。因此,每個(gè)算法定義的邊界不明確,每個(gè)聚類(lèi)算法都有自己的*優(yōu)結(jié)果,每個(gè)數(shù)據(jù)部分都會(huì)產(chǎn)生一條信息。為了說(shuō)明相同的數(shù)據(jù)由于不同的算法產(chǎn)生不同的結(jié)果,需要注意不同的判斷方式。遺傳學(xué)家很難從任何算法(尤其是邊界)中正確解釋聚類(lèi)內(nèi)容的實(shí)際結(jié)果。*終,需要經(jīng)驗(yàn)可信度來(lái)通過(guò)序列比較來(lái)指導(dǎo)聚類(lèi)解釋。
第二個(gè)限制是由線(xiàn)性相關(guān)引起的。以上所有聚類(lèi)方法都只分析了簡(jiǎn)單的一對(duì)一關(guān)系。由于只是成對(duì)的線(xiàn)性比較,大大減少了發(fā)現(xiàn)表達(dá)類(lèi)型關(guān)系的計(jì)算量,卻忽略了生物系統(tǒng)的多因素和非線(xiàn)性特性。
從統(tǒng)計(jì)學(xué)的角度來(lái)看,聚類(lèi)分析是一種通過(guò)數(shù)據(jù)建模來(lái)簡(jiǎn)化數(shù)據(jù)的方法。傳統(tǒng)的統(tǒng)計(jì)聚類(lèi)分析方法包括系統(tǒng)聚類(lèi)、分解、加法、動(dòng)態(tài)聚類(lèi)、有序樣本聚類(lèi)、重疊聚類(lèi)和模糊聚類(lèi)。許多著名的統(tǒng)計(jì)分析軟件包,如SPSS、SAS等,都加入了使用k-means、k-center point等算法的聚類(lèi)分析工具。
從機(jī)器學(xué)習(xí)的角度來(lái)看,聚類(lèi)等價(jià)于隱藏模式。聚類(lèi)是搜索聚類(lèi)的無(wú)監(jiān)督學(xué)習(xí)過(guò)程。與分類(lèi)不同,無(wú)監(jiān)督學(xué)習(xí)不依賴(lài)于預(yù)定義的類(lèi)或帶有類(lèi)標(biāo)簽的訓(xùn)練示例。它需要由聚類(lèi)學(xué)習(xí)算法自動(dòng)確定,而分類(lèi)學(xué)習(xí)的實(shí)例或數(shù)據(jù)對(duì)象有類(lèi)標(biāo)簽。聚類(lèi)是觀察學(xué)習(xí),而不是示范學(xué)習(xí)。
從實(shí)際應(yīng)用的角度來(lái)看,聚類(lèi)分析是數(shù)據(jù)挖掘的主要任務(wù)之一、就數(shù)據(jù)挖掘功能而言,聚類(lèi)可以作為一個(gè)獨(dú)立的工具來(lái)獲取數(shù)據(jù)的分布,觀察每個(gè)數(shù)據(jù)簇的特征,并針對(duì)特定的簇進(jìn)行進(jìn)一步分析。
聚類(lèi)分析也可以作為其他數(shù)據(jù)挖掘任務(wù)(如分類(lèi)和關(guān)聯(lián)規(guī)則)的預(yù)處理步驟。
數(shù)據(jù)挖掘領(lǐng)域主要研究高效實(shí)用的大型數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)聚類(lèi)分析算法。
聚類(lèi)分析是數(shù)據(jù)挖掘中一個(gè)非?;钴S的研究領(lǐng)域,已經(jīng)提出了很多聚類(lèi)算法。
這些算法可以分為劃分方法、層次方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法。
1 分區(qū)方法(PAM:PARTitioningmethod)先創(chuàng)建k個(gè)分區(qū),k是要?jiǎng)?chuàng)建的分區(qū)數(shù);然后使用循環(huán)
定位技術(shù)通過(guò)將對(duì)象從一個(gè)分區(qū)移動(dòng)到另一種質(zhì)量來(lái)幫助改進(jìn)分區(qū)。典型的劃分方法包括:
k-means、k-medoids、CLARA(ClusteringLARgeApplication)、
CLARANS(ClusteringLargeApplicationbaseduponRANdomizedSearch)。 2 分層方法(hierarchicalmethod)創(chuàng)建層次結(jié)構(gòu)來(lái)分解給定的數(shù)據(jù)集。這種方法可以分為自頂向下(分解)和自底向上(合并)兩種操作模式。為了彌補(bǔ)分解和合并的缺點(diǎn),層次整合往往與其他聚類(lèi)方法相結(jié)合,例如循環(huán)定位。典型的此類(lèi)方法包括:
第一種是; BIRCH(BalancedIterativeRecingandClusteringusingHierarchies)方法,它首先利用樹(shù)的結(jié)構(gòu)來(lái)劃分對(duì)象集;然后使用其他聚類(lèi)方法來(lái)優(yōu)化這些聚類(lèi)。
第二種是CURE(ClusteringUsingREprisentatives)方法,用固定數(shù)量的代表對(duì)象來(lái)表示對(duì)應(yīng)的簇;然后每個(gè)集群按照指定的數(shù)量(向集群中心)收縮。

第三種是ROCK方法,利用簇之間的連接來(lái)合并簇。
*后一個(gè)CHEMALOEN是在層次聚類(lèi)過(guò)程中構(gòu)建一個(gè)動(dòng)態(tài)模型。
3 基于密度方法,根據(jù)密度完成對(duì)象的聚類(lèi)。它根據(jù)對(duì)象周?chē)拿芏炔粩嘣鲩L(zhǎng)簇(例如
DBSCAN)。典型的基于密度的方法包括:
DBSCAN(Densit-basedSpatialClusteringofApplicationwithNoise):該算法通過(guò)不斷增長(zhǎng)的具有足夠高密度的區(qū)域來(lái)執(zhí)行聚類(lèi)
;它可以從包含噪聲的空間數(shù)據(jù)庫(kù)中找到任意形狀的簇。該方法將簇定義為一組“密度連接”點(diǎn)。
OPTICS (OrderingPointsToIdentifytheClusteringStructure):不顯式生成
簇,而是計(jì)算增強(qiáng)的聚類(lèi)順序以進(jìn)行自動(dòng)交互式聚類(lèi)分析。 .
4 基于網(wǎng)格法,首先將物體空間劃分為有限單元,形成網(wǎng)格結(jié)構(gòu);然后使用網(wǎng)格結(jié)構(gòu)完成聚類(lèi)。
STING (STatisticalINformationGrid) 是一種使用存儲(chǔ)在網(wǎng)格單元中的統(tǒng)計(jì)信息以
為基礎(chǔ)的網(wǎng)格聚類(lèi)方法。
CLIQUE (ClusteringInQUEst) 和Wave-Cluster 是一種基于網(wǎng)格和基于密度的基于平方5 的模型方法的組合,它假設(shè)每個(gè)簇的模型并找到適合相應(yīng)模型的數(shù)據(jù)。典型的
基于模型的方法包括:
統(tǒng)計(jì)方法COBWEB:是一種常用且簡(jiǎn)單的增量概念聚類(lèi)方法。它的輸入對(duì)象由符號(hào)量(屬性-值)對(duì)描述。使用分類(lèi)樹(shù)的形式創(chuàng)建層次聚類(lèi)。
CLASSIT 是 COBWEB 的另一個(gè)版本。它可以執(zhí)行連續(xù)值屬性的增量聚合。它為每個(gè)節(jié)點(diǎn)中的每個(gè)屬性保存了相應(yīng)的連續(xù)正態(tài)分布(均值和方差);并且采用了改進(jìn)的分類(lèi)能力描述方法,即不像COBWEB那樣計(jì)算離散屬性(值)
Sum是對(duì)連續(xù)屬性的積分。但是CLASSIT方法也有與COBWEB類(lèi)似的問(wèn)題。
所以它們不適合集群大型數(shù)據(jù)庫(kù)。
相關(guān)閱讀Relate
|
|
|
|
|
熱門(mén)文章 Recent
- 日語(yǔ)翻譯公司的收費(fèi)標(biāo)準(zhǔn)是什么2023-03-11
- 小語(yǔ)種游戲本地化翻譯的收費(fèi)標(biāo)準(zhǔn)2023-03-11
- 英文譯中文翻譯1000字多少錢(qián)2023-03-11
- 翻譯一篇1500字英文要多少錢(qián)2023-03-11
- 網(wǎng)絡(luò)小說(shuō)翻譯價(jià)格(網(wǎng)文翻譯多少錢(qián))2023-03-11
- 法語(yǔ)文件翻譯價(jià)格(法語(yǔ)文件翻譯如何收費(fèi))2023-03-11
- 德語(yǔ)專(zhuān)利翻譯價(jià)格2023-03-11
- 翻譯公司價(jià)格不同的原因有哪些2023-03-11
- 聚類(lèi)分析翻譯多少錢(qián)-什么是聚類(lèi)分析?2023-03-11
- 游戲本地化翻譯的價(jià)格(游戲本地化翻譯多少錢(qián))2023-03-11