
廣州市黃埔區(qū)學(xué)大道攬?jiān)侣窂V州企業(yè)孵化器B座402
電話:020-85625352
手機(jī):18102256923、18102253682
Email:[email protected]
Fax:020-85625352
QQ:386244141
項(xiàng)目名稱:Call Peak 流程簡(jiǎn)介
所屬分類:生物信息學(xué)分析
聯(lián)系電話:020-85625352
QQ:386244141
Email:[email protected]
技術(shù)服務(wù)描述
Call Peak 流程簡(jiǎn)介

對(duì)于ChIP-seq實(shí)驗(yàn),我們從比對(duì)文件中觀察到的是鏈的不對(duì)稱性,其中+/-鏈上的讀取密度位于結(jié)合位點(diǎn)的中心。所選片段的5'末端將在正鏈和負(fù)鏈上形成基團(tuán)。然后使用統(tǒng)計(jì)方法評(píng)估這些組的分布,并與背景(輸入或模擬IP樣本)進(jìn)行比較,以確定富集位點(diǎn)是否可能是真實(shí)的結(jié)合位點(diǎn)。

MACS2
MACS2,一個(gè)基于模型分析的,常用于ChIP-seq識(shí)別轉(zhuǎn)錄因子結(jié)合位點(diǎn)的工具。 MACS算法捕獲基因組的復(fù)雜性的影響,以評(píng)估豐富的CHIP區(qū)域的意義。盡管它是為檢測(cè)轉(zhuǎn)錄因子結(jié)合位點(diǎn)而開(kāi)發(fā)的,但它也適用于較大的區(qū)域。
MACS通過(guò)結(jié)合測(cè)序標(biāo)簽位置和方向信息來(lái)提高結(jié)合位點(diǎn)的空間分辨率。MACS可以輕松地單獨(dú)用于ChIP樣品,也可以與增加峰值調(diào)用特異性的對(duì)照樣品一起使用。MACS工作流程如下所示。

配對(duì)峰建立模型
真實(shí)結(jié)合位點(diǎn)周圍的標(biāo)簽密度應(yīng)顯示雙峰富集模式(或成對(duì)的峰)。MACS利用這種雙峰模式來(lái)對(duì)移動(dòng)大小進(jìn)行經(jīng)驗(yàn)建模,以更好地定位精確的結(jié)合位點(diǎn)。
為了找到配對(duì)峰以建立模型,MACS首先掃描整個(gè)數(shù)據(jù)集,以尋找高度重要的富集區(qū)域。僅使用ChIP示例即可完成!給定超聲處理的大?。╞andwidth)和高置信度的折疊富集(mfold),MACS會(huì)bandwidth在基因組上滑動(dòng)兩個(gè)窗口,以找到具有相對(duì)于隨機(jī)標(biāo)簽基因組分布而言富集程度更高的標(biāo)簽的mfold區(qū)域。
MACS隨機(jī)采樣這些高質(zhì)量峰中的1,000個(gè),分離其正鏈和負(fù)鏈標(biāo)簽,并按其中心之間的中點(diǎn)對(duì)齊它們。的在對(duì)準(zhǔn)的兩個(gè)峰的模式之間的距離被定義為“d”和表示所估計(jì)的片段長(zhǎng)度。MACS將所有標(biāo)簽朝著3'末端移動(dòng)d / 2到最可能的蛋白質(zhì)-DNA相互作用位點(diǎn)。


糾正低映射區(qū)域中真實(shí)信號(hào)的丟失
為了從標(biāo)簽數(shù)計(jì)算λBG,MAC2需要有效的基因組大小或可映射的基因組大小??捎成湫耘c基因組中特定位置的k聚體的獨(dú)特性有關(guān)。低復(fù)雜度和重復(fù)區(qū)域的唯一性較低,這意味著可映射性較低。因此,我們需要提供有效的基因組長(zhǎng)度,以糾正低映射區(qū)域中真實(shí)信號(hào)的丟失。


峰值檢測(cè)
MACS將每個(gè)標(biāo)簽移動(dòng) d / 2 后,它會(huì)使用2d的窗口大小在基因組中滑動(dòng)以找到候選峰。沿著基因組的標(biāo)簽分布可以通過(guò)泊松分布來(lái)建模。泊松是一個(gè)參數(shù)模型,其中參數(shù)λ是該窗口中預(yù)期的讀取次數(shù)。


MACS2輸出文件
.narrowPeak 是 BED 6 + 4 格式,表示標(biāo)準(zhǔn)BED文件的前6列以及4個(gè)其他字段:


