专利摘要:
Beschrieben sind Techniken zum Verarbeiten von Datensätzen, die durch ein Analysieren einer Probe erzeugt werden. Der Eingangsdatensatz wird als Zeilen von Intensitäten über der Zeit für einen bestimmten Masse-Ladung-Bereich (m/z-Bereich) dargestellt. Eine Korrelationsmatrix wird erzeugt, in der jede Zeile des Eingangsdatensatzes mit jeder weiteren Zeile in dem Eingangsdatensatz korreliert wird. Die Korrelationsmatrix wird derart geclustert oder gruppiert, daß diese stark korrelierten m/z-Bereiche in der gleichen Gruppe enthalten sind. Ein Satz einer oder mehrerer Abtastungen wird für jede Gruppe ausgewählt, was interessierende Zeiträume innerhalb jeder Gruppe darstellt. Unter Verwendung der m/z-Werte, die in jeder Gruppe enthalten sind, wird ein resultierendes Probenspektrum für jede der ausgewählten Abtastungen erzeugt. Die Verarbeitungstechniken können verwendet werden, um Stamm- und verwandte Fragmentionen in dem Eingangsdatensatz zu identifizieren, sowie als ein Vor-Verarbeiter verwendet werden, der resultierende abgetastete Spektren erzeugt, die als Eingabe zur nachfolgenden Verarbeitung verwendet werden.
公开号:DE102004015018A1
申请号:DE102004015018
申请日:2004-03-26
公开日:2005-01-20
发明作者:David Lee Fort Collins Gines;William M. Boulder Old;Dean R. Fort Collins Thompson
申请人:Agilent Technologies Inc;
IPC主号:G01N27-62
专利说明:
[0001] DieseAnmeldung ist eine Teilfortführungsanmeldungder US-PatentanmeldungNr. 10/388,088, eingereicht am 13. März 2003, mit dem Titel „Methodsand Devices for Identifying Biopolymers Using Mass Spectroscopy" von Dean R. Thompsonund Steven M. Fischer, die hierin in ihrer Gesamtheit durch Bezugnahme aufgenommenist.
[0002] DieseAnmeldung bezieht sich auf eine Massenspektralanalyse und insbesondereauf ein Verarbeiten von Massenspektren, die durch eine Massenspektralanalyseerzeugt werden.
[0003] DieMassenspektroskopie ist ein leistungsstarkes analytisches Werkzeug,das beim Identifizieren unbekannter Verbindungen, sowie ihrer Mengenverwendet werden kann. Die Massenspektroskopie kann z. B. auch beimErmitteln der Struktur und chemischer Eigenschaften von Molekülen nützlich seinund kann in Verbindung mit sowohl organischen als auch anorganischenSubstanzen verwendet werden. Die Identifizierung von Proteinen undweiteren Molekülenin einer komplexen Mischung, die aus biologischen Quellen hergeleitet ist,kann unter Verwendung der Massenspektroskopie durchgeführt werden.Eine Vielzahl unterschiedlicher Techniken wurde zur Verwendung beider Identifizierung von Molekülen,wie z. B. Proteinen, entwickelt.
[0004] Voreinem Durchführeneiner Massenspektroskopie trennt eine Technik verschiedene Proteinein der Mischung unter Verwendung einer zweidimensionalen Gel-Elektrophorese(2DE). Die resultierenden Punkte können herausgeschnitten und-gezogen werden, um die Proteine in kürzere Polypeptid-Ketten zuzerlegen. Diese Auszügekönnen über Massenspektroskopie analysiertwerden und das resultierende Spektrum kann mit Spektren verglichenwerden, die aus Aminosäuresequenzenund Informationen, die in Datenbanken enthalten sind, vorausgesagtwerden. Die vorangegangene Technik weist z. B. eine Schwierigkeitbeim Auflösen starksaurer und hydrophober Proteine auf.
[0005] Umdie vorangegangenen Schwierigkeiten bei der ersten Technik zu überwinden,wurden Anstrengungen unternommen, um die Trennung derartiger Mischungen über eineHochleistungs-Flüssigchromatographie (HPLC)durchzuführen.Diese Bemühungenumfassen ein Herausziehen aller Proteine in der Mischung vor einemAngehen von Trenntechniken, was zu einer hyper-komplexen Mischungführt.Unter Verwendung einer derartigen hyper-komplexen Mischung ist esunter Umständenweder praktisch noch möglich,eine vollständige undperfekte Trennung zu schaffen. Vielmehr sind in dem Eluat, das indas Massenspektrometer gelangt, unter Umständen mehrere Peptide zu jedemZeitpunkt vorhanden, derart, daß mehrerePeptide ko-eluieren, was zu Massenspektren führt, die eine Mischung vonIonen von den verschiedenen vorhandenen Peptiden enthalten können.
[0006] DasVorangegangene kann durch zwei zusätzliche Faktoren weiter verkompliziertwerden. Erstens neigen großeMoleküle,wie z. B. Peptide, unter Umständendazu, eine großeLadung währendeiner Elektro-Sprüh-Ionisierungzu sammeln. Als ein Ergebnis der Elektro-Sprüh-Ionisierung und der Sammlungeiner großenLadung kann das Spektrum jedes Peptids unter Umständen mehrereSpitzen bzw. Peaks aufweisen, die den mehreren Ladungszuständen entsprechen.Zusätzlichlösen hochauflösende Massenspektrometer, wiez. B. Laufzeitvorrichtungen, unter Umständen mehrere isotope Spitzenfür jedenLadungszustand auf. Als ein Ergebnis der obigen Faktoren kann einsehr komplexes Spektrum resultieren.
[0007] Umdie Komplexitätder resultierenden Spektren zu reduzieren, können Techniken, wie z. B. eineLadungszuweisung und eine Isotoprückbildung, durchgeführt werden.Diese Techniken könnenjedoch empfindlich auf verschiedene Typen von Interferenz und Rauschen,sowohl chemischer als auch elektrischer Natur, sein.
[0008] Zusätzlich istein vollständigerDatensatz von Spektren, die z. B. durch eine Flüssigchromatographie/Massenspektrometrie-Verarbeitung(LC/MS) erzeugt werden, u. U. ziemlich groß. Ein Spektrum kann bei verschiednenFrequenzen, wie z. B. mehrere Male pro Sekunde oder alle paar Sekunden, über einenZeitraum von mehreren Stunden genommen werden. Die Größe einesderartigen Datensatzes stellt eine Anzahl von Herausforderungengemäß einemAnalysieren derartiger großerDatenmengen dar.
[0009] EineTechnik zum Reduzieren der Rechenlast in Verbindung mit derartigengroßenDatenmengen besteht darin, nur bestimmte zu analysierende Spektrendetailliert gemäß bestimmtenKriterien auszuwählen. DieseSpektren werden jedoch üblicherweisemanuell durch eine visuelle Inspektion der Chromatographiedatenausgewählt,was zeitaufwendig, schwerfälligund fehleranfälligsein kann.
[0010] Folglichkann es wünschenswertsein, eine Technik zum Analysieren von Chromatographieinformationen,wie z. B. in einem LC/MS-Datensatz vorhanden sein können, undVerwenden der resultierenden Analyseinformationen zur Trennung verwandterIonen in Spektren, die einzelne Verbindungen darstellen, bereitzustellen.Es kann ebenso wünschenswertsein, die resultierenden Analyseinformationen zu verwenden, um die bestimmtenSpektren zur nachfolgenden Analyse zu identifizieren, die maximaleSignalpegel bereitstellen. Es kann ebenso wünschenswert sein, ein Rauschenaus den Daten zu entfernen und zu filtern und die Größe und Komplexität des zuanalysierenden Datensatzes wesentlich zu reduzieren. Es kann ebensowünschenswert sein,eine derartige Technik in Verbindung mit einer Proteinidentifizierungzu verwenden, sowie dieselbe allgemein für die Analyse weiterer Klassenvon Molekülen,die ähnlicheCharakteristika teilen, anzuwenden.
[0011] Esist die Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahrenzum Identifizieren verwandter Ionen, ein verbessertes Verfahrenzum Quantifizieren oder ein Computerprogrammprodukt mit verbessertenCharakteristika zu schaffen.
[0012] DieseAufgabe wird durch ein Verfahren gemäß Anspruch 1 oder 20 oder einComputerprogrammprodukt gemäß Anspruch21 oder 40 gelöst.
[0013] Gemäß einemAspekt der Erfindung wird ein Verfahren zum Identifizieren verwandterIonen in einem Eingangsdatensatz, der durch ein Analysieren einerProbe erzeugt wird, mit folgenden Schritten bereitgestellt: Korrelierenjeder Zeile von Daten in einem Eingangsdatensatz mit jeder weiterenZeile von Daten in dem Eingangsdatensatz, was eine Korrelationsmatrixerzeugt, wobei jede Zeile Intensitäten über der Zeit für einenbestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedesElement der Korrelationsmatrix einen Korrelationswert umfaßt und einenzugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, dieidentifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswertzugeordnet sind; Gruppieren (Clustern) der Korrelationsmatrix, waszumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrixals in der zumindest einen Gruppe befindlich identifiziert, wobeijede Gruppe kovariierende Chromatogramme darstellt; Auswählen zumindesteines interessierenden Zeitraums für jede Gruppe; und Erzeugeneines resultierenden Spektrums fürjede Gruppe durch ein Abtasten von Chromatogrammen, die in jederGruppe enthalten sind, zu jedem des zumindest einen interessierendenZeitraums der Verwendung einer Form des Eingangsdatensatzes.
[0014] Gemäß einemweiteren Aspekt der Erfindung wird ein Verfahren zum Quantifizierenzumindest eines Ions in einem Eingangsdatensatz, der durch ein Analysiereneiner Probe erzeugt wird, mit folgenden Schritten bereitgestellt:Korrelieren jeder Zeile von Daten in einem Eingangsdatensatz mitjeder weiteren Zeile von Daten in dem Eingangsdatensatz, was eineKorrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über derZeit für einenbestimmten Masse-Ladung-Bereich(m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrix einenKorrelationswert umfaßtund einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist,die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswertzugeordnet sind; Gruppieren der Korrelationsmatrix, was zumindesteine Gruppe und zumindest eine Zeile der Korrelationsmatrix alsin der zumindest einen Gruppe befindlich identifiziert, wobei jedeGruppe chemisch verwandte Komponenten darstellt, die ein korreliertesChromatographieverhalten zeigen; Auswählen zumindest eines interessierendenZeitraums fürjede Gruppe; und Erzeugen eines resultierenden Spektrums für jede Gruppedurch ein Abtasten von Chromatogrammen, die in jeder der Gruppenenthalten sind, zu jedem des zumindest einen interessierenden Zeitraumsder Verwendung einer Form des Eingangsdatensatzes.
[0015] Gemäß einemweiteren Aspekt der Erfindung wird ein Computerprogrammprodukt zumIdentifizieren verwandter Ionen in einem Eingangsdatensatz, derdurch ein Analysieren einer Probe erzeugt wird, mit folgenden Merkmalenbereitgestellt: einem maschinenausführbaren Code, der jede Zeilevon Daten in einem Eingangsdatensatz mit jeder weiteren Zeile vonDaten in dem Eingangsdatensatz korreliert, was eine Korrelationsmatrixerzeugt, wobei jede Zeile Intensitäten über der Zeit für einenbestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedes Elementder Korrelationsmatrix einen Korrelationswert umfaßt und einen zugeordnetenZeilen- und einen Spaltenidentifizierer aufweist, die identifizieren,welche Zeilen in dem Eingangsdatensatz dem Kor relationswert zugeordnetsind; einem maschinenausführbarenCode, der die Korrelationsmatrix gruppiert, was zumindest eine Gruppeund zumindest eine Zeile der Korrelationsmatrix als in der zumindesteinen Gruppe befindlich identifiziert, wobei jede Gruppe ko-variierendeChromatogramme darstellt; einem maschinenausführbaren Code, der zumindesteinen interessierenden Zeitraum für jede Gruppe auswählt; undeinem maschinenausführbarenCode, der ein resultierendes Spektrum für jede Gruppe durch ein Abtastenvon Chromatogrammen, die in jeder der Gruppen enthalten sind, zujedem des zumindest einen interessierenden Zeitraums der Verwendungeiner Form des Eingangsdatensatzes erzeugt.
[0016] Gemäß noch einemweiteren Aspekt der Erfindung wird ein Computerprogrammprodukt zumQuantifizieren zumindest eines Ions in einem Eingangsdatensatz,der durch ein Analysieren einer Probe erzeugt wird, mit folgendenMerkmalen bereitgestellt: einem maschinenausführbaren Code, der jede Zeilevon Daten in einem Eingangsdatensatz mit jeder weiteren Zeile vonDaten in dem Eingangsdatensatz korreliert, was eine Korrelationsmatrixerzeugt, wobei jede Zeile Intensitäten über der Zeit für einenbestimmten Masse-Ladung-Bereich(m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrixeinen Korrelationswert umfaßtund einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist,die identifizieren, welche Zeilen in dem Eingangdatensatz dem Korrelationswertzugeordnet sind; einem maschinenausführbaren Code, der die Korrelationsmatrixgruppiert, was zumindest eine Gruppe und zumindest eine Zeile derKorrelationsmatrix als in der zumindest einen Gruppe befindlichidentifiziert, wobei jede Gruppe chemisch verwandte Komponenten darstellt,die ein korreliertes Chromatographieverhalten zeigen; einem maschinenausführbarenCode, der zumindest einen interessierenden Zeitraum für jede Gruppeauswählt;und einem maschinenausführbarenCode, der ein resultierendes Spektrum für jede Gruppe durch ein Abtastenvon Chromatogrammen, die in jeder der Gruppen enthalten sind, zujedem des zumindest einen interessierenden Zeit raums der Verwendungeiner Form des Eingangsdatensatzes erzeugt.
[0017] BevorzugteAusführungsbeispieleder vorliegenden Erfindung werden nachfolgend Bezug nehmend aufdie beigefügtenZeichnungen nähererläutert.Es zeigen:
[0018] 1 ein Beispiel eines Blockdiagramms,das Verarbeitungsschritte einer Substanz darstellt, die in ein Massenspektrometereingegeben wird;
[0019] 2 ein Beispiel eines Ausführungsbeispielseines Computersystems aus 1;
[0020] 3 ein Beispiel eines Ausführungsbeispielseines Hosts, der in dem Computersystem aus 2 enthalten ist;
[0021] 4 ein Beispiel eines Funktionsblockdiagrammsvon Komponenten, die in einem Massenspektrometer aus 1 enthalten sind;
[0022] 5–9 beispielhaftegraphische Darstellungen alternativer Anzeigen von Daten, die ausdem Massenspektrometer aus 4 ausgegebenwerden;
[0023] 10 ein Flußdiagrammvon Verfahrensschritten eines exemplarischen Ausführungsbeispielszum Durchführeneiner Ionenidentifizierung und Filterverarbeitung bezüglich Daten,die aus dem Massenspektrometer aus 4 ausgegebenwerden;
[0024] 11 ein Flußdiagrammvon Verfahrensschritten eines beispielhaften Ausführungsbeispielszum Verarbeiten unterschiedlicher Typen von Massenspektral-Datensätzen;
[0025] 12 ein Flußdiagrammvon Verfahrensschritten eines beispielhaften Ausführungsbeispielszum Durchführeneines Clusterns oder einer Gruppierung stark korrelierter Zeilen,wie sie in den Verarbeitungsschritten des Flußdiagramms aus 10 oder 11 verwendetwird; und
[0026] 13–17 beispielhaftegraphische Darstellungen von Datensätzen bei verschiedenen Verarbeitungsschrittendes Verfahrens aus 11.
[0027] Bezugnehmend auf 1 ist einBeispiel eines Blockdiagramms von Verarbeitungsschritten gezeigt, diein Verbindung mit einer Identifizierung eines Moleküls innerhalbeiner Mischung bei einem Ausführungsbeispieldurchgeführtwerden können.Bei diesem bestimmten Beispiel kann die Substanz eine Mischung auseinem oder mehreren Molekülen,wie z. B. Peptiden oder Proteinen, sein, die zur Identifizierungverarbeitet werden. Es wird darauf verwiesen, daß die hierin beschriebenenTechniken auch beim Durchführeneiner quantitativen Analyse von Molekülen in einer Probe verwendetwerden können.Eine Eingangsprobe oder Substanz 12 wird in der enzymatischenAuszugsverarbeitung (digestion processing) 14 herausgezogen(digeriert). Diese enzymatische Auszugsverarbeitung 14 brichtdie Proteine in der Probe 12 in kürzere Polypeptid-Ketten auf. Danachkönnendie Auszüge über eineTrennverarbeitungstechnik 16 getrennt werden. Jede einerVielzahl unterschiedlicher Trennverarbeitungstechniken kann verwendetwerden, wie z. B. Flüssigchromatographie, 2D-Gel-Trennungund dergleichen. Es wird darauf verwiesen, daß im allgemeinen jede Trenntechnikund/oder Auszugstechnik verwendet werden kann, um die verschiedenenPolypeptide z. B. gemäß Molekulargewicht, elektrischenFeldern und dergleichen zu trennen.
[0028] Nachder Trennverarbeitung 16 können die resultierenden Abscheidungenin ein Massenspektrometer 18 eingegeben werden, was Massenspektraldaten 20 alseine Ausgabe erzeugt. Die Massenspektraldaten können in eine Ionenidentifizierungs- und Filterverarbeitung 24 eingegebenwerden. Die Ionenidentifizierungs- und Filterverarbeitung 24 kannein Computersystem 26 in Verbindung mit einem Durchführen vonVerarbeitungsschritten in demselben verwenden. Details über diespezifischen Verarbeitungsschritte, die in Verbindung mit der Ionenidentifizierungs-und Filterverarbeitung 24 durchgeführt werden, sind an andererStelle detaillierter beschrieben. Nachfolgend kann die Ausgabe derIonenidentifizierungs- und Filterverarbeitung 24 als eine Eingabein eine Nachverarbeitung 22 dienen.
[0029] DieNachverarbeitung 22 kann z. B. ein Durchführen einerIsotoprückbildungoder Ladungszuweisung umfassen. Die Nachverarbeitung 22 kannz. B. auch einen Vergleich überwachterAusgangsdaten mit bekannten Spektraldaten umfassen, um z. B. einenbestimmten bekannten Typ und eine Menge zu identifizieren, die Proteinenund dergleichen zugeordnet sind, die in der Probe 12 enthaltensein können.Die Nachverarbeitung 22 kann auch das Computersystem 26 verwenden.Es wird darauf verwiesen, daß dieNachverarbeitung 22 das gleiche oder ein anderes Computersystemals das verwenden kann, das in Verbindung mit den Verarbeitungsschrittender Ionenidentifizierungs- und Filterverarbeitung 24 verwendetwurde. Als eine Ausgabe der Nachverarbeitung können Probeinformationsergebnisse 23 erzeugtwerden. Die Ergebnisse 23 können z. B. Typen bekannterProteine und Mengen umfassen, die in der Probe 12 identifiziertwerden.
[0030] Eswird angemerkt, daß,obwohl die bestimmte Probe oder Substanz 12, die im vorangegangenenund währenddieses gesamten Beispiels beschrieben wird, ein Protein sein kann,die hierin beschriebenen Techniken auch in Verbindung mit anderenTypen von Substanzen oder Proben 12 zur Identifizierungweiterer Moleküleund/oder zugeordneter Mengen verwendet werden können. Ein Ausführungsbeispielkann zusätzliche oderandere Verarbeitungsschritte als diejenigen, die hierin beschriebensind, gemäß dem Typvon Probe oder Sub stanz 12, die zu analysieren ist, sowieden bestimmten zu identifizierenden Komponenten innerhalb der Probeoder Substanz umfassen. Dies kann die Verarbeitungsschritte beeinflussen,die sowohl vor als auch nach der Verarbeitung durch das Massenspektrometerdurchgeführtwerden. Die enzymatische Auszugsverarbeitung kann z. B. auch nichtin Verbindung mit einem Durchführeneiner Analyse einer Probe oder Substanz verwendet werden, die keineProteine umfaßt.
[0031] Bezugnehmend auf 2 ist eindetaillierteres Beispiel eines Ausführungsbeispiels des Computersystems 26 gezeigt.Es wird darauf verwiesen, daß 2 nur eine bestimmte Anordnungeines Computersystems darstellt, das in dem Ausführungsbeispiel 10 aus 1 enthalten sein kann.
[0032] DasComputersystem 26 umfaßtein Datenspeichersystem 112, das mit Host-Systemen 114a–114n undeinem Datenverwaltersystem 116 durch ein Kommunikationsmedium 118 verbundenist. Bei diesem Ausführungsbeispieldes Computersystems 26 können die N Hosts 114a–114n unddas Datenverwaltersystem 116 auf das Datenspeichersystem 112 z.B. beim Durchführenvon Eingangs-/Ausgangs-(I/O-)Operationen oder Datenanforderungenzugreifen. Das Kommunikationsmedium 118 kann jedes einerVielzahl von Netzen bzw. Netzwerken oder ein weiterer Typ von Kommunikationsverbindungsein, wie dies fürFachleute auf diesem Gebiet bekannt ist. Das Kommunikationsmedium 18 kanneine Netzverbindung, ein Bus und/oder ein weiterer Typ von Datenverbindungsein, wie z. B. eine Festverdrahtung oder weitere Verbindungen,die in der Technik bekannt sind. Das Kommunikationsmedium 118 kannz. B. das Internet, ein Intranet, Netz oder eine oder mehrere weitereVerbindungen sein, durch die die Host-Systeme 114a–114n unddas Datenverwaltersystem auf das Datenspeichersystem 112 zugreifenund mit demselben kommunizieren können und auch mit weiterenElementen, die in dem Computersystem 26 enthalten sind,kommunizieren können.
[0033] Jedesder Host-Systeme 114a–114n,das Datenverwaltersystem 116 und das Datenspeichersystem 112,die in dem Computersystem 26 enthalten sind, können mitdem Kommunikationsmedium 118 durch jede einer Vielzahlvon Verbindungen verbunden sein, wie dies gemäß dem Typ von Kommunikationsmedium 118 vorgesehenund unterstütztwird. Die Prozessoren, die in den Host-Computersystemen 114a–114n unddem Datenverwaltersystem 116 enthalten sind, können gemäß jedembestimmen Ausführungsbeispielund der Anwendung jedes einer Vielzahl kommerziell erhältlicherEin- oder Mehrprozessorsysteme sein, wie z. B. ein Intel-basierterProzessor, ein IBM-Mainframeoder ein weiterer Typ kommerziell erhältlichen Prozessors, der in derLage ist, einen eingehenden Verkehr zu unterstützen.
[0034] Eswird darauf verwiesen, daß diebestimmten Details der Hardware und Software, die in jedem der Host-Systeme 114a-114n unddem Datenverwaltersystem 116 enthalten sind, sowie derKomponenten, die in dem Datenspeichersystem 112 enthaltensein können,bei jedem bestimmten Ausführungsbeispielvariieren können.Jeder der Host-Computer 114a–114n, sowie das Datenverwaltersystem 116 können sichan dem gleichen physischen Ort befinden oder können sich alternativ auch anunterschiedlichen physischen Orten befinden. Beispiele des Kommunikationsmediums,das zur Bereitstellung der unterschiedlichen Typen von Verbindungenzwischen den Host-Computersystemen,dem Datenverwaltersystem und dem Datenspeichersystem des Computersystems 26 verwendetwerden kann, könneneine Vielzahl unterschiedlicher Kommunikationsprotokolle verwenden,wie z. B. SCSI, ESCON, Faserkanal oder GIGE(Gigabit-Ethernet) unddergleichen. Einige oder alle der Verbindungen, durch die die Hosts,das Datenverwaltersystem 116 und das Datenspeichersystem 112 mitdem Kommunikationsmedium 118 verbunden sein können, können durchweitere Kommunikationsvorrichtungen laufen, wie z. B. eine Connectrix-oder eine weitere Schaltausrüstung,die vorliegen kann, wie z. B. eine Telephonleitung, einen Repeater,einen Multiplexer oder sogar einen Satellit.
[0035] Jedesder Host-Computersysteme sowie das Datenverwaltersystem können unterschiedlicheTypen von Datenoperationen gemäß unterschiedlichenTypen von Verwaltungsaufgaben durchführen. Bei dem Ausführungsbeispielaus 2 kann jeder derHost-Computer 114a–114n eineDatenanforderung an das Datenspeichersystem 112 ausgeben,um eine Datenoperation durchzuführen.Eine Anwendung kann z. B. in Verbindung mit der Ionenidentifizierungs-und Filterverarbeitung 24 aufgerufen werden und kann aufeinem der Host-Computer 114a–114n ausgeführt werden.
[0036] Eswird darauf verwiesen, daß dasin dem System 10 aus 1 enthalteneComputersystem 26 auch ein einzelner Computer, wie z. B.ein Personalcomputer, sowie eine weitere Anordnung einer Mehrzahlvon Computersystemen, wie oben beschrieben ist, sein kann.
[0037] Bezugnehmend auf 3 ist eindetaillierteres Beispiel eines Ausführungsbeispiel eines Host-Computersystem 114a-114n gezeigt,das in dem Computersystem 26 enthalten sein kann. Das Host-Computersystem 114a kannKomponenten, wie z. B. einen oder mehrere Prozessoren 130,einen Speicher 132 oder eine oder mehrere Datenspeichereinheiten 134,sowie eine Anzeige 136 und eine oder mehrere Eingabevorrichtungen 138 umfassen.All diese Komponenten innerhalb eines Computersystems 114a können Benutzerdaten undBefehlsinformationen unter Verwendung eines lokalen Bus 140 kommunizierenund übertragen.
[0038] Eswird darauf verwiesen, daß diefür dasHost-Computersystem 114a enthaltenen Komponenten auch diejenigenKomponenten sein können,die in einem Ausführungsbeispielenthalten sind, bei dem das Computersystem 26 ein einzelnerComputer, wie z. B. ein einzelner Personalcomputer, ist, der inVerbindung mit der Nachverarbeitung und der Ionenidentifizierungs-und Filterverarbeitung 24 verwendet werden kann.
[0039] Bezugnehmend auf 4 ist einBeispiel eines Ausführungsbeispielseines Massenspektrometers 18 gezeigt. Ein Massenspektrometerkann als ein Instrument charakterisiert werden, das die Masse-Ladung-Verhältnisseeinzelner Moleküle,die in Ionen umgewandelt wurden, mißt. Wie in den folgenden Absätzen beschriebenist, mißtein Massenspektrometer tatsächlichnicht die Molekularmasse direkt, sondern bestimmt vielmehr ein Masse-Ladung-Verhältnis derIonen, die aus einem bestimmten Molekül oder Molekülen gebildet werden.Eine nützlicheEinheit fürhierin beschriebene Zwecke ist eine Einheit, die sich auf eine Grundladungseinheit,die Größe der Ladungauf einem Elektron, bezieht. Die Ladung eines Ions kann durch dieGanzzahl z der Grundladungseinheit angegeben werden und das Masse-Ladung-Verhältnis kannals m/z bezeichnet werden.
[0040] 4 umfaßt die unterschiedlichen Funktionseinheiteneines Massenspektrometers, das begrifflich in dem Blockdiagramm 18 aus 4 dargestellt sein kann.Eine Probe kann übereinen Einlaß 156 ineine Vakuumkammer eingeführtwerden. Es wird darauf verwiesen, daß eine Probe in einer einerVielzahl unterschiedlicher Formen vorliegen kann, einschließlich z.B. einer flüssigenLösung,eingebettet in eine feste Matrix, oder als Dampf. Abhängig vondem Typ von Einlaß undverwendeten Ionisierungstechniken kann die Probe auch bereits alsIonen in Lösungvorliegen oder sie kann in Verbindung mit ihrer Verflüchtigungoder durch weitere Verfahren in der Ionenquelle 150 ionisiertwerden. Bei diesem Ausführungsbeispielwird die Probe, wenn dieselbe in den Einlaß 156 eingeführt wird,in einer Gasphase plaziert und dann geladen, um Ionen zu erzeugen. DieIonen werden durch einen Analysator 152 gemäß ihrenMasse-Ladung- oder m/z-Verhältnissensortiert und dann durch einen Ionendetektor 154 gesammelt.In dem Ionendetektor 154 kann der Ionenfluß in einen elektrischenProportionalstrom umgewandelt werden. Die Ausgabe des Ionendetektors 54 dientals eine Eingabe in das Datensystem 158, das die Größe der verschiedenenelek trischen Signale als eine Funktion der m/z-Verhältnisseaufzeichnet und die Informationen in Massenspektrometerdaten 20 umwandelt.
[0041] Eswird darauf verwiesen, daß inder vorangegangenen allgemeinen Beschreibung bezüglich eines Massenspektrometersunterschiedliche Typen von Massenspektrometern von den in 4 enthaltenen Komponentenvariieren können.Die oben beschrieben Ionensortierung kann z. B. in einem Quadrupolinstrument enthaltensein, jedoch nicht in einem TOF-Massenspektrometer,da das TOF-Massenspektrometer die Flugzeit der Ionen in einem Rohrmit fester Längemißt.Die hierin beschriebenen Techniken können mit jedem Typ von Massenspektrometerverwendet werden und jede Beschreibung eines bestimmten Typs vonMassenspektrometer sollte nicht als Einschränkung der Anwendung der hierinbeschriebenen Techniken aufgefaßtwerden.
[0042] Eswird darauf verwiesen, daß einAusführungsbeispieleine Ionenauswahlverarbeitung als Teil der Ionensortierung 152 umfassenkann, bei der nur ein Teil der bestimmten Ionen zur weiteren Verarbeitungund Analyse ausgewähltwird. Wie an anderer Stelle hierin gezeigt und beschrieben ist,ist die Massenspektral-Datenausgabe aus dem Massenspektrometer 18 imallgemeinen ein Graph einer Ionenintensität auf der y-Achse als eineFunktion des Masse-Ladung-Verhältnis(m/z), das auf der x-Achse des Spektrums angezeigt sein kann. Eswird darauf verwiesen, daß dieaus dem Massenspektrometer 18 kommenden Ionen sowohl positiv alsauch negativ geladen sein können.
[0043] Wiedies hierin beschrieben ist, kann die Probe in einer einer Vielzahlvon Formen vorliegen, wenn sie in den Einlaß 156 eingeführt wird.Wenn die Probe z. B. ein Feststoff ist, kann die Probe in eine Gasphase verdampftoder sublimiert werden, wie z. B. durch Erwärmen. Gase und Flüssigkeitenkönnendurch Einlaßentwürfe eingeführt werden,die den Fluß steuern.Einige Ausführungsbeispielekönnenver schiedene Techniken bei der Verarbeitung kombinieren, wie z.B. Verflüchtigungund Ionisierung, die gleichzeitig auftreten. Die Probe kann aucheine Mischung sein, in der die einzelnen Komponenten vor einer Eingabeund Analyse durch das Massenspektrometer getrennt werden können. EineTrennung ist in Verbindung mit dem Verarbeitungsschritt 16 aus 1 beschrieben. Die Trennungkann verwendet werden, um Massenspektren für eine Probe mit mehreren Komponentenzu vereinfachen, indem die Anzahl ko-eluierender Verbindungen reduziertwird. Eine Gaschromatographie kann mit der Massenspektrometrie alsein Mittel zur Trennung gekoppelt sein, wie hierin ebenso beschriebenist. Die Gaschromatographie z. B. kann es ermöglichen, daß Verbindungen, die bereitsin einer Dampfphase vorliegen, zeitlich getrennt in das Massenspektrometergelangen, so daß Komponentenvon Mischungen erfaßtund analysiert werden können.Flüssigchromatographenkönnenauch verwendet werden, ebenso wie Kapillar-Elektrophorese-Vorrichtungenund weitere Typen von Hardware und/oder Software, die in Verbindungmit einem Durchführender Trennverarbeitung vor einer Einführung einer Probe in ein Massenspektrometer 18 verwendetwerden.
[0044] Molekular-und Fragmentionen könnenin der Ionenquelle 150 erzeugt werden, wie in 4 gezeigt ist. Wenn dieEingabe nicht bereits ionisiert ist, kann jede einer Vielzahl unterschiedlicherIonisierungstechniken verwendet werden, z. B. einschließlich einerElektro-Sprüh-Ionisierung(ESI). Es wird angemerkt, daß,obwohl sowohl positive als auch negative Ionen in der Ionenquellegleichzeitig erzeugt werden können,eine einzelne Polaritätzu einer bestimmten Zeit aufgezeichnet werden kann. Ein bestimmtesMassenspektrum kann positive oder negative Ionen umfassen. Die Ionenwerden dann in das Ionensortieren oder den Analysator 152 eingegeben.Der Analysator kann eine Dispersion oder ein Filtern verwenden,um Ionen gemäß den Masse-Ladung-Verhältnissenoder anderen relativen Eigenschaften zu sortieren. Analysatorenkönnenz. B. Magnetsektoren, Quadrupol-Massefilter,Fourier-Transformierungs-Ionenzyklotron-Reso nanzspektrometer, Flugzeit-Massenanalysatorenund dergleichen umfassen. Nachfolgend werden die durch den Ionensortiereroder Analysator 152 erzeugten sortierten Ionen in die Ionenerfassungsverarbeitung 154 eingegeben,bei der die bestimmte Ladung der Ionen bestimmt wird.
[0045] Eswird darauf verwiesen, daß einComputer in Verbindung mit einem Steuern des Massenspektrometerssowie bei einer Spektralerfassung, -speicherung und -vorlage verwendetwerden kann. Wie hierin z. B. in Verbindung mit der Verarbeitungdes Blockdiagramms 10 aus 1 beschriebenist, könneneine Software und/oder Hardware in einem Computersystem in Verbindungmit einem Durchführeneiner Quantisierung, Spektralinterpretation und Verbindungsidentifizierungverwendet werden.
[0046] Eswird ebenso darauf verwiesen, daß zusätzlich zu der ESI-Technik zur Erzeugungvon Ionen als ein Ergebnis der Quellenverarbeitung 150 innerhalbdes Massenspektrometers eine chemische Ionisierung, Desorptionsionisierung,Elektro-Sprüh-Ionisierungund dergleichen in Verbindung mit einem Durchführen einer Ionisierung verwendetwerden können.Es wird darauf verwiesen, daß für Polypeptideund dergleichen (Biomoleküle)Techniken, wie z. B. ESI, Matrix-gestützte Laserdesorptionsionisierung(MALDI), Atmosphärendruck-MALDI(AP-MALDI), und weitere „weiche" Ionisierungstechnikengegenüber „harten" Ionisierungstechnikenbevorzugt werden. Weich und hart in bezug auf Ionisierungstechnikenbezieht sich auf die Energiepegel, die zur Ionisierung der interessierendenMoleküleverwendet werden. Harte Ionisierungstechniken sind mit Biomolekülen nichtkompatibel, da sie zu einer ausgedehnten Fragmentierung führen.
[0047] Trenntechniken,wie z. B. Gaschromatographie (GC), Flüssigchromatographie (LC) unddergleichen, wie dies hierin beschrieben ist, können in Verbindung mit derMassenspektrometrie verwendet werden, um chemische Verbindungenzu identifizieren. In Verbindung mit der Verwendung eines Mas senspektrometers (MS)mit einem Gas- oder Flüssigchromatographenkann eine Schnittstelle verwendet werden, um den Gasfluß in dasMassenspektrometer einzuschränkenoder zu reduzieren. Dies kann z. B. dazu führen, daß eine Schnittstelle zwischender Trennverarbeitung 16 und dem Massenspektrometer 18 eingeführt wird,wie in Verbindung mit 1 gezeigtist. Jede Chromatographietechnik, wie z. B. LC, C, FF-Elektrophoreseund dergleichen, kann in Verbindung mit Biomolekülen verwendet werden. Die Verwendungvon Flüssigphasentechniken kannaufgrund der Leichtigkeit, mit der dieselben schnittstellenmäßig miteinem Massenspektrometer verbunden werden können, zusätzlich zu der Fähigkeiteiner Überwachungdes Chromatographieverhaltens eluierender Komponenten bevorzugtwerden.
[0048] InVerbindung mit GC/MS, LC/MS oder weiteren Kombinationen bestehendie Ausgangsdaten der Massenspektren 20 aus einer Serievon überder Zeit erfaßtenMassenspektren. Um diese Informationen zu erzeugen, kann das Massenspektrometerden Massebereich fürz. B. einen bestimmten m/z-Bereich wiederholt für einen bestimmten Chromatographiedurchlaufabtasten. Eine Abtastung kann bei einer vorbestimmten Frequenz,wie z. B. jede Sekunde oder mehrere Male pro Sekunde, durchgeführt werden.
[0049] Diebestimmte ausgewählteAbtastfrequenz kann gemäß einemAusführungsbeispielvariieren. Ein Ausführungsbeispielkann eine Abtastfrequenz auswählen,die mit der durchschnittlichen erwarteten Spitzenbreite variiert,und kann z. B. um eine Größenordnunggrößer alsdieselbe sein. Bei einem Ausführungsbeispiel tastetdas Massenspektrometer mit einer Geschwindigkeit ab, die zehnmalhöher alsdie Geschwindigkeit ist, mit der die Verbindungen eluieren. Dies überträgt sichauf zumindest 10 Abtastungen übereine durchschnittliche Chromatographiespitze.
[0050] Bezugnehmend auf 5 ist eineForm einer graphischen Darstellung der Spektraldaten, wie dieselbenangezeigt wer den können,gezeigt. Eine graphische Anzeige 200 aus 5 zeigt ein Gesamtionenchromatogramm(TIC). Das TIC stellt die Intensitäten aller Ionen dar, wie dieselbenin Verbindung mit jeder bestimmten Abtastung zusammengefaßt sind.So stellt das TIC eine gesammelte Menge einer Ionenintensität bei jederAbtastung dar.
[0051] Bezugnehmend auf 6 ist einBeispiel einer graphischen Darstellung 250 dessen gezeigt,wie ein TIC 260 weiter durch eine Mehrzahl einzelner Ionenprofile 270 dargestelltsein kann. Ein bestimmter Punkt 271a in dem TIC 260 kanndurch ein Summieren der einzelnen Ionenprofile 271b dargestelltwerden, wie bei 270 entlang der Richtung, die durch einenPfeil 272 angezeigt ist, dargestellt ist. 6 zeigt alternative Datenanzeigen vonChromatographiedaten, wie dieselben aus dem Massenspektrometer 18 ausgegebenwerden können.
[0052] Eswird darauf verwiesen, daß inVerbindung mit einem Erfassen von Spektren bei einer bestimmten Frequenzdie bestimmte Frequenz gemäß jedemAusführungsbeispielvariieren kann. Bei den hierin beschriebenen Techniken z. B. können Spektrenmehrere Male pro Sekunde gesammelt werden. Es wird darauf verwiesen,daß TICsdurch Rauschkomponenten des Datensatzes bewirkt werden.
[0053] Bezugnehmend auf 7 ist einBeispiel einer weiteren Form dessen gezeigt, wie eine Datenausgabeaus einem Massenspektrometer angezeigt werden kann. Die Datenanzeige 280 kannals eine Konturdarstellung bezeichnet werden, bei der die Abtastzahlauf der x-Achse ist. Der bestimmte m/z-Wert wird auf der y-Achsedargestellt, wobei die Intensitätals ein Grauskalawert dargestellt ist. Ein vertikales Betrachteneines Stücksdurch die Darstellung 280 aus 7 führtzu einem Spektrum füreine bestimmte Elutionszeit. Ein horizontales Stück der graphischen Darstellung 280 aus 7 stellt den Ionenstromfür einenbestimmten m/z-Wert über derZeit dar, der üblicherweiseals das extrahierte Ionenchromatogramm (XIC) bezeichnet wird.
[0054] Bezugnehmend auf 8 ist einBeispiel der graphischen Darstellung 300 eines XIC gezeigt.Die Darstellung 300 stellt ein XIC für ein m/z-Verhältnis von 100 über derZeit dar.
[0055] InVerbindung mit den XICs ist anzumerken, daß zwei oder mehr Komponenteneiner ursprünglichen Mischungzu einem bestimmten Zeitpunkt ko-eluieren können. Die Elutionsprofile jederder jeweiligen zwei Komponenten jedoch zeigen in den meisten Fällen Unterschiede über eineSerie von Zeitpunkten oder Abtastungen. Es ist ebenso anzumerken,daß Ionen,die aus den Vorgängendes Massenspektrometers resultieren, dazu neigen können, chromatographischzu ko-variieren, indem ähnlicheElutionsprofile zu sehen sind.
[0056] Bezugnehmend auf 9 ist einBeispiel einer graphischen Darstellung 350 gezeigt, dieXICs fürvier unterschiedliche überlagertem/z-Werte darstellt. Alle vier m/z-Werte sind an einem AbtastpunktT ko-eluierend, wie auf der Darstellung 350 identifiziertist. Es wird jedoch angemerkt, daß nur die Ionen 3 und 4 ko-variierendsind. Ko-variierende Ionen könnenbei diesem Beispiel in einem Konturdiagramm, wie in 7 gezeigt ist, als eine Serie horizontalerBalken, die in einer Spalte angeordnet sind, sichtbar sein. Wenndie XICs der entsprechenden Ionen 3 und 4 geprüft werden,kann jedoch eine Ähnlichkeitder Elutionsprofile beobachtet werden. Diese Beobachtungen bezüglich Kovarianzkönnenbei den hierin beschriebenen Verarbeitungsschritten verwendet werden.
[0057] Bezugnehmend auf 10 ist einFlußdiagrammvon Verarbeitungsschritten gezeigt, die in einem Ausführungsbeispielder Ionenidentifizierungs- und Filterverarbeitung 24 enthaltensein können,die zuvor in Verbindung mit 1 beschriebenwurde. Bei einem Schritt 402 werden die Spektren als einErgebnis einer Massenspektrometerverarbeitung erzeugt, z. B. einLC/MS-Datensatz einer Zeitserie von Spektren. Der Datensatz kannals drei Spalten von Daten dargestellt werden, die eine Abtastzahl,einen m/z-Wert und eine entsprechende Intensität umfassen. Dies kann so sein,wie in der beispielhaften Anzeige 280 aus 7 dargestellt ist. Der gleiche Satz vonEingangsdaten kann auch als eines oder mehrere XICs dargestelltsein, die hierin an anderer Stelle beschrieben sind, wobei jederm/z-Wert überder Zeit überwachtwird. Jedes XIC ist die Abtastzahl oder Zeit auf der x-Achse, wobeidie Intensität über derZeit auf der y-Achse überwachtwird. Es gibt einen XIC fürjeden m/z-Wert. Das Format der Daten, die in Verbindung mit denhierin beschriebenen Verarbeitungsschritten verwendet werden, isteine zweidimensionale Matrix, die einen Zeilenindex auf der y-Achse desm/z-Verhältnisund einen Spaltenindex auf der Y-Achse einer Abtastzahl aufweist.Der Wert innerhalb einer Zelle oder eines Eintrags, identifiziertdurch eine Zeile und eine Spalte, ist der zugeordnete Intensitätswert.
[0058] Beieinem Schritt 404 könnendie Daten mit null oder mehr Filtern gefiltert werden, um Rauschkomponentenzu entfernen und/oder den Datensatz in bestimmte m/z-Bereiche oderZeiträumezu partitionieren. Es wird darauf verwiesen, daß, um das „Rauschen" in dem zu analysierenden Datensatzzu reduzieren, die Auswahl von Filtern und die bestimmte Kombinationund Reihenfolge, die verwendet wird, abhängig von der Qualität der Datenvariieren kann. Bei einem Ausführungsbeispielz. B. könnendie folgenden Filtertechniken verwendet werden: 1.Abschneiden der Daten unterhalb einer bestimmten Schwelle 2. Medianwert-Filter 3. 2-D-Gauss-Faltung-Filter 4. Entfernen von Gleichstrom-Rauschen unter Verwendung von Gleichstrom-Filtertechniken
[0059] Dieseund weitere Filtertechniken sind z. B. in W.K. Pratt mit dem Titel „DigitalImage Processing" (Digitalbildverarbeitung)von John Wiley & Sons,1991, New York, zu finden.
[0060] UnterVerwendung der vorangegangenen Typen von Filtertechniken bei einemexemplarischen Ausführungsbeispielist die Ausgabe der Filterverarbeitung aus Schritt 404 eineDatenmatrix mit der gleichen Anzahl von Spalten (Abtastungen oderZeitpunkten) wie die ursprünglicheMatrix. Ein Ausführungsbeispielkann als ein Ergebnis der Verarbeitung aus Schritt 404 imVergleich zu der Anzahl von Zeilen in dem ursprünglichen Datensatz aufgrundder Entfernung der null Zeilen, die durch ein Filtern von Rauschenerzeugt werden, eine reduzierte Anzahl von Zeilen aufweisen. DieGröße der Datenreduzierunghängt vonder Grenzschwelle in Schritt 1 oben sowie anderen Filterparameternab, die in Verbindung mit der Verarbeitung der Schritte 2 bis 4 verwendetwerden, die bei einem Ausführungsbeispielverwendet werden kann. Bei einem Ausführungsbeispiel in Verbindungmit den Schritten 1 bis 4, wie oben herausgestellt, können dievorangegangenen Parameter mit zugeordneten Verarbeitungsschrittenverwendet werden: Schritt 1) schneidet Werte ab, die kleiner als5% des Maximums sind, Schritt 2) 5 × 5-Medianwert-Filtern und Schritt3) Verwenden eines Gauss-Filters mit einer Breite, die in etwa dieerwartete Breite der Chromatographiespitzen ist. In Verbindung mitdem oben angemerkten Filterschritt 4 ist keine Parameterauswahlnötig.Es wird darauf verwiesen, daß dievorangegangenen Techniken, sowie Richtlinien für deren Verwendung, bekanntsind.
[0061] EinAusführungsbeispielkann bei einem Ausführungsbeispieljede Kombination von Hardware und/oder Software zur Implementierungder vorangegangenen Filterverarbeitung verwenden. Bei einem Ausführungsbeispielunter Verwendung von Software zur Implementierung der vorangegangenenFilter schritte und einer weiteren hierin beschriebenen Verarbeitungkönneneine oder mehrere Programmiersprachen, wie z. B. C, C++, Java, FOTRAN,und/oder eines oder mehrere Softwarepakete, wie z. B. MATLAB, verwendet werden.Die bestimmten Elemente könnengemäß dem, wasin jeder Implementierung verfügbarist, variieren.
[0062] Alseine Alternative zu oder zusätzlichzu der Filterverarbeitung bei Schritt 404 kann ein Ausführungsbeispielden Datensatz partitionieren, um die Anzahl von Zeilen in der Datenmatrixzu reduzieren. Ein Ausführungsbeispielkann z. B. nur diejenigen Zeilen von Daten innerhalb eines bestimmtenm/z-Bereichs auswählen. Datenspitzenkönnenz. B. bestimmt werden und ein bestimmter m/z-Bereich kann für einenBereich von Werten beim Aufspannen einer Datenspitze ausgewählt werden.Die Verwendung einer Partitionierung bei diesem Verarbeitungsschrittbezieht sich auf ein Verfahren zur Datenreduzierung. An einem bestimmtenPunkt wird eine Partitionierung unter Umständen bei einem Ausführungsbeispielaufgrund von Speichereinschränkungen aufgrundder Größe der resultierendenKorrelationsmatrix, die in an anderer Stelle beschriebenen Verarbeitungsschrittengebildet und verwendet wird, nötig.Die Größe der Korrelationsmatrixhängt vonder Anzahl von Zeilen in der ursprünglichen Datenmatrix (Anzahlvon Nicht-Null-Massenabtastwerten) ab. Es wird z. B. ein Ausführungsbeispielbetrachtet, das die hierin beschriebenen Verarbeitungsschritte inVerbindung mit dem Flußdiagramm 400 unterVerwendung von Flugzeit-(TOF-)Datensätzen durchführt, die mehr als 100.000 Massenabtastwertefür jedesSpektrum in dem Datensatz aufweisen. Wenn alle m/z-Zeilen des Datensatzesbetrachtet werden, und zwar unter der Annahme, daß kein Abschneidenoder Filtern auftritt, weist die Korrelationsmatrix 1e10 Elementeauf, was mit 4 Bytes pro Element zu einer 39 GB-Matrix führt. EinAusführungsbeispielkann die Partitionierungstechnik verwenden, um die Größe der Matrixzu reduzieren.
[0063] WiederBezug nehmend auf 7 kannder Graph 280 durch einen Datensatz in Matrixform dargestelltsein, der in dem dargelegten Datensatz z. B. etwa 250 m/z-Zeilenaufweist. TatsächlicheDatensätzeneigen dazu, sehr viel größer zu sein,dies dient jedoch als ein gutes Beispiel. Bezug nehmend auf denGraphen 280 könnensechs Hauptspitzen unterschieden werden. Eine Spitzenfindungsroutinekann verwendet werden, um die Hauptspitzen Bezug nehmend auf einebestimmte Abtastzahl zu lokalisieren. Eine Spitzenfindungstechnik,die bei einem Ausführungsbeispielverwendet werden kann, basiert auf der Berechnung von Ableitungen.Bei dem Spitzenmaximum z. B. ist die erste Ableitung 0 und die zweiteAbleitung ist negativ. Die Spitzenfindungsroutine kann in der Zeit-und der m/z-Dimension durchgeführtwerden, um die Spitzen zu finden. Ein Bereich von Abtastungen kannausgewähltwerden, ein +/––Bereichswertder Spitze, und nur Abtastungen für die Maxima können untersuchtwerden. Die mehreren Zeilen in jeder Spitze können z. B. durch ein Kombinierender Zeilen durch ein Addieren derselben reduziert werden. Ein Ausführungsbeispielkann auch den Medianwert von Proben nehmen. Ein Ausführungsbeispielkann auch die maximale repräsentativeZeile fürdie Massenspitze auswählen.Ein weiteres Ausführungsbeispielkann die Verwendung von Bildverarbeitungsalgorithmen umfassen, wiez. B. des Wasserscheidenalgorithmus, um eine Spitzenfindung gleichzeitigin der Zeit- und der m/z-Dimension durchzuführen. Der Wasserscheidenalgorithmus,sowie weitere Bildverarbeitungstechniken, sind in der Technik bekanntund z. B. in K.R. Castleman, „DigitalImage Processing" (Digitalbildverarbeitung),Prentice-Hall Inc., New Jersey, 1996 beschrieben. Bei diesem Ausführungsbeispiel,das den Wasserscheidenalgorithmus verwendet, wird der Datensatzals ein Bild behandelt, wie z. B. in 13 gezeigtist. Als erstes werden die lokalen Maxima unter Verwendung einerErweiterte-Minima-Transformierung bestimmt und auf das Bild übertragen,wie z. B. in Pierre Soille, Morphological Image Analysis: Principlesand Applications, (Morphologische Bildanalyse: Prinzipien und Anwendungen),Springer-Verlag, 1999, Seiten 170–171, beschrieben ist. Dieshilft eine Übersegmentierungwährendnachfolgender Verarbeitungsschritte zu reduzieren. Als nächstes wirdeine Wasserscheidensegmentierung bezüglich des Bildes durchgeführt, diedie Spitzengrenzen (in Zeit und Masse) erfaßt und Spitzen segmentiert,die nicht vollständigaufgelöstsind. Ein Verwenden des Vorangegangenen weist mehrere Vorteile auf.Die Spitzen, die aus mehreren Massenzeilen oder Chromatogrammenbestehen, könnenin ein Einspitzenchromatogramm kombiniert werden, indem alle Intensitäten innerhalbder Spitzengrenze auf eine Zeile-für-Zeile-Weise summiert werden.Die Spitzenchromatogramme könnendann als Eingaben in den Gruppierungsalgorithmus dienen, anstattdaß jedeMassenzeile in dem Datensatz verwendet wird. Dies führt zu einerwesentlichen Reduzierung der Anzahl von Zeilen, die in den Gruppierungsalgorithmuseingegeben werden, sowie einer kleineren Größe der resultierenden Korrelationsmatrix.Zusätzlichist ein Spitzenteilen mit dieser Technik nicht mehr notwendig, dadie Spitzenerfassung dies automatisch durchführt. Ferner kann eine Quantitationdurch ein Summieren der Intensitäteninnerhalb der Spitzengrenzen durchgeführt werden.
[0064] EinVerwenden eines der vorangegangenen Elemente führt zu einem Zusammenfallender mehreren Zeilen in eine Spitze. Es wird darauf verwiesen, daß unterschiedlichehier verwendete Techniken nachfolgende Verarbeitungsschritte bewirkenkönnen.Wenn z. B. Zeilen miteinander addiert werden, wird die bei Schritt 414 in 10 gezeigte Verarbeitungebenso beeinflußt.Ohne derartige Spitzenfindungsroutinen werden mehrere Zeilen vonDaten füreine einzelne Spitze in einer Datenmatrix als Eingabe in eine Korrelationsroutineverwendet, was aufgrund der hohen Korrelation von Zeilen innerhalbeiner einzelnen Spitze redundant ist. Wieder Bezug nehmend auf denbeispielhaften Datensatz mit 250 Zeilen kann dieser auf eine Matrixvon 6 bis 10 Zeilen reduziert werden, entsprechend der Anzahl vonSpitzen, was auch die Größe der Korrelationsmatrixreduziert.
[0065] Eswird darauf verwiesen, daß diePartitionierung gegenübereinem Filtern füreinen großenDatensatz, der z. B. größer als10.000 m/z-Abtastwerte ist, aufgrund der Computerressourcen undder Zeit, die zum Durchführeneiner Verarbeitung der großenDatensätzebenötigtwird, bevorzugt werden kann.
[0066] Beieinem Schritt 406 wird jede Zeile, Gruppe von Zeilen oderPartition unter Verwendung einer bestimmten Funktion mit jeder weiterenZeile, Gruppe von Zeilen oder Partition korreliert, was eine Korrelationsmatrixerzeugt, die den Grad darstellt, zu dem die Zeilen aufeinander bezogensind. Jede Zeile stellt Intensitäten über derZeit füreinen bestimmten m/z-Bereich dar. Die resultierende Korrelationsmatrixist eine zweidimensionale Matrix, die symmetrisch um die Diagonaleist, derart, daß dieDiagonaleneinträge1 sind und der obere und der untere Dreiecksabschnitt identischsind. Anders ausgedrücktist jeder Eintrag, der die Tiefstellungen „i, j," aufweist, der gleiche Wert in dem Eintragmit den Tiefstellungen „j,i". Die Korrelationfür zweiZeilen x und y kann folgendermaßendargestellt werden:
[0067] Beieinem Schritt 412 wird jedes Cluster oder jede Gruppe vonm/z-Bereichen durch eine Funktion geleitet, um einen Satz relevanterAbtastungen auszuwählen,die interessierende Perioden darstellen. Bei einem Ausführungsbeispielkönnendie eine oder die mehreren Abtastungen durch ein anfänglichesBestimmen eines Maximalpunktes durch ein Summieren der Intensitäten derXICs an jedem Abtastpunkt innerhalb jeder Gruppe, z. B. durch einAddieren der Zeilen des Datensatzes für alle Zeilen innerhalb jederGruppe, bestimmt werden. Die Abtastung, die dem maximalen Punktoder der Spitzenintensitätentspricht, kann als eine interessierende Abtastung bestimmt werden.Ein Ausführungsbeispielkann außerdemmehr als eine interessierende Abtastung durch ein Bestimmen einesAbtastbereichs, z. B. unter Verwendung des Spitzen- oder Maximalwertes, bestimmen.Die ausgewählteninteressierenden Abtastungen könnendiejenigen Abtastungen sein, die innerhalb eines +/––Bereichswertsder Spitze fallen, wobei der Bereichswert mit einem Ausführungsbeispielvariieren kann. Der Bereichswert kann z. B. 1/2 des Spitzenwertssein.
[0068] EineTechnik zum Auswählendes Bereichs einer Chromatographiespitze besteht darin, den Bereich auszuwählen, derdie volle Breite bei halbem Maximum (FWHM) ist, was bedeutet, daß der Bereichzwischen den beiden Punkten auf jeder Seite der Spitze ausgewählt wird,die auf halber Höheder Spitze liegen. Weitere Ausführungsbeispielekönnenweitere Techniken zur Bereichsbestimmung verwenden.
[0069] Wiedies hierin beschrieben ist, variieren die eine oder die mehrereninteressierenden Abtastungen mit dem Ausführungsbeispiel. Ein Ausführungsbeispielkann einen einzelnen Punkt als eine interessierende Abtastung bestimmen,die z. B. das maximale durchschnittliche Ionensignal für die ausgewählten m/z-Werteoder den Zeitschwerpunkt der Gruppe darstellt. Ein Ausführungsbeispielkann einen Bereich von Abtastungen, wie z. B. den vollständigen Satzvon Abtastungen auswählen,die ein Signal fürausgewähltem/z-Werte aufweisen, und dergleichen. Mehr als eine Abtastung kannz. B. ausgewähltwerden, wenn das Signal schwach ist und/oder ein übermäßiges Rauschenvorliegt, um das Signal-Rausch-Verhältnis zuerhöhen.Eine Technik summiert alle Spalten, die ein Signal für die Gruppeenthalten, um das Signal zu maximieren.
[0070] DieSteuerung fährtmit einem Schritt 413a fort, bei dem eine Bestimmung durchgeführt wird,ob eine Quantitation durchgeführtwird. Quantitation bezieht sich im allgemeinen auf den Verarbeitungsschritteines Bestimmens einer Menge oder Quantität eines Moleküls anstattauf ein Identifizieren eines bestimmten Typs oder Typen von Molekülen. Wenneine Quantitation durchgeführtwird, fährtdie Steuerung mit einem Schritt 413b fort, bei dem Zeilen(Chromatogramme) miteinander addiert werden. Eine relative Quantitationwird durch eine Integration einer Chromatographiespitze durchgeführt, umden Spitzenbereich zu erhalten, der proportional zu der Quantität der Komponentein der Mischung ist. Die vorangegangene Integration summiert die Intensitäten für einenbestimmten m/z-Bereich zwischen zwei Zeitpunkten, die die interessierendeSpitze aufspannen.
[0071] Beieinem Schritt 414 könnender oder die m/z-Werte fürjedes Cluster oder jede Gruppe, wie dies in dem Eingangsdatensatzenthalten ist, verwendet werden, um ein abgetaste tes Spektrum für jede derAbtastungen zu erzeugen, die in Schritt 412 ausgewählt werden,was nur die m/z-Werte der Gruppe darstellt. Anders ausgedrückt wirdfür jedeneines oder mehrerer interessierender Abtastwerte eine entsprechendeSpalte von Intensitätenaus dem ursprünglichenDatensatz verwendet, um ein Spektrum für jede Gruppe zu erzeugen.Es wird darauf verwiesen, daß,wenn die Verarbeitung aus Schritt 414 durchgeführt wird,ein Ausführungsbeispiel denursprünglichenDatensatz oder eine gefilterte Form des ursprünglichen Datensatzes verwendenkann, um die resultierenden Spektren zu erzeugen.
[0072] Diebei Schritt 402 erzeugten Eingangsdaten, die in der vorangegangenenVerarbeitung verwendet werden, könnendurch ein Laufenlassen des Massenspektrometers bei Normalenergiepegeln(U-Spektrum), Hoch-Fragmentierungs-Energiepegeln (F-Spektrum) oder ineinem abwechselnden Abtastmodus, der abwechselnd U- und F-Spektrenerzeugt, gesammelt werden. Wenn ein abwechselnder Abtastmodus verwendet wird,der Datensätzeerzeugt, die abwechselnd U- und F-Spektren umfassen, kann die Chromatographiekorrelationder Stamm-Peptide (U-Spektren)und ihrer jeweiligen Fragmentionen (F-Spektren) verwendet werden, umStämmeihren Fragmenten zuzuordnen. Diese Charakteristik von Zeit- oderAbtastkorrelation zwischen Stämmenund zugeordneten Fragmenten kann z. B. in Fällen verwendet werden, in denenmehrere Stämme gleichzeitigfragmentiert werden, jedoch ausreichende Unterschiede in ihren jeweiligenElutionsprofilen zeigen. Die jeweiligen Unterschiede in dem Elutionsprofilmachen es möglich,daß eineUnterscheidung zwischen den unterschiedlichen Stämmen an geeignete Fragmenteangepaßtwerden kann.
[0073] Wenndie Eingangsdaten unter Verwendung des abwechselnden Abtastmoduserzeugt werden, könnenzwei unterschiedliche Ansätzebei einer Verarbeitung der Eingangsdaten verwendet werden. BeideAnsätzesind in den folgenden Absätzenbeschrieben. Bei einem ersten Ansatz können das U- und das F-Spektrum kombiniertwerden. Bei einem zweiten alternativen Ansatz können das U- und das F-Spektrumseparat verarbeitet werden.
[0074] Für den erstenAnsatz werden die U- und die entsprechenden F-Spektralpaare voreinem Durchführen vonSchritt 406 miteinander addiert. Es wird darauf verwiesen,daß dasF-Spektrum vor einemDurchführender Summierung des F- und des entsprechenden U-Spektrums gefiltertwerden kann. Diese Filterung kann z. B. aufgrund der geringerenIntensitätvon Fragmentierungsspektren durchgeführt werden. Bei einem Ausführungsbeispielwird eine Kombination aus Basislinien-Subtraktion, Kalman-Glättung undSavitzky-Golay-Filterung durchgeführt. Nach der Durchführung derSummierung kann eine zusätzlicheFilterung ebenso bezüglich derzusammengesetzten Spektren durchgeführt werden. Korrelation, Filtern,Gruppieren, Auswahl relevanter Abtastungen und eine weitere Verarbeitung,die den Schritten 406, 408, 410 und 412 zugeordnetist, fährt dann,wie hierin an anderer Stelle beschrieben, fort, was zu einem Satzvon Komponentenspektren (U und F kombiniert) führt. In den folgenden Absätzen wirddies als der A-Satz bezeichnet. Wenn die Schritt 414 zugeordneteVerarbeitung durchgeführtwird, werden zwei unterschiedliche Spektren erzeugt – einesaus dem ursprünglichenU-Spektrum bei einer ausgewähltenAbtastung füreine Gruppe und ein zweites F-Spektrum, das bei der gleichen Abtastungabgetastet wird.
[0075] Beidem ersten Ansatz könnendie Vorläufer-(Stamm-)Ionendurch ein anfänglichesHerleiten der A-Satz-Spektren, die kombiniert U und F darstellen,und ein darauffolgendes Abtasten des ursprünglichen Nur-U-Datensatzesbei den Massen, die in dem Satz A vorhanden sind, und bei dem Abtastmaximum,das für denSatz A identifiziert ist, identifiziert werden. Die Stammionen sinddort, wo Intensitätenbei den abgetasteten Massen in den Nur-U-Spektren vorliegen.
[0076] Diekombinierten Spektren in dem A-Satz sollten unter der Annahme, daß keineStämmeexakt die gleichen Chromato graphieprofile aufweisen, den m/z-Wertdes Stamms mit Fragmenten von nur diesem Stamm enthalten. Der nächste Schrittbesteht darin zu bestimmen, welcher m/z-Wert in diesem A-Spektrum der Stammist. Die in dem A-Spektrum identifizierten m/z-Werte werden dannverwendet, um die ursprünglichenU-Spektren bei dem fürdas Spektrum A identifizierten Abtastmaximum abzutasten. Intensitäten, diebei diesen abgetasteten Massen in dem U-Spektrum auftreten, zeigendie Stamm-Ionenmassen an. Die Abwesenheit eines Signals bei einemabgetasteten Wert von m/z zeigt ein Fragmention an. Durch ein Durchführen des Vorangegangenenwerden die Stammmassen innerhalb des kombinierten U-F-Komponentenspektrums,des Spektrums A, identifiziert.
[0077] Zusätzlich zudem ersten Summierungsansatz kann ein zweiter Zeitkorrelationsansatzeingesetzt werden. Die Korrelationsverarbeitung aus Schritt 406 kannz. B. separat bezüglichdes U- und des F-Datensatzes durchgeführt werden. Das U- und das F-Spektrumkönnenmit den oben beschriebenen Abtastwerten in einem abwechselnden Modusabgetastet werden. Es sollte darauf verwiesen werden, daß zur Verwendungdieses zweiten Ansatzes die F-Spektren ein ausreichendes Signal-Rausch-Verhältnis für eine zufriedenstellendeKorrelation aufweisen sollten. Falls dies nicht der Fall ist, kannsich die Summierungstechnik unter Umständen besser eignen. Zusätzlich können, wiebei dem Summierungsverfahren, Filtertechniken bezüglich jedesdes F- und/oder des U-Spektrums durchgeführt werden. Es wird daraufverwiesen, daß unterschiedlicheFiltertechniken bei einem Ausführungsbeispielaufgrund des typischen niedrigeren Signal-Rausch-Verhältnisbezüglich derF-Spektren verwendet werden könnten,was die F-Spektren fehlerempfindlicher macht. Wie bei dem Summierungsverfahrensollte eine 1-zu-1-Entsprechung zwischen den Spektren in sowohldem U- als auch dem F-Satz, den Stämmen in den Sätzen vonU und den Fragmenten in den Sätzenvon F, zeitkorreliert, vorliegen.
[0078] Bezugnehmend auf 11 ist einFlußdiagramm 600 vonVerfahrensschritten eines Ausführungsbeispielszum Durchführeneiner Verarbeitung von Eingangsspektren, die unter Verwendung einesMassenspektrometers erzeugt werden, das in einem abwechselnden Abtastmodusarbeitet, gezeigt. Das Flußdiagramm 600 faßt die obenbeschriebenen Verarbeitungsschritte zusammen.
[0079] Beieinem Schritt 602 wird eine Bestimmung durchgeführt, obder Eingangsdatensatz abwechselnd U- und F-Spektren umfaßt. Fallsdies nicht der Fall ist, fährtdie Steuerung mit einem Schritt 604 fort, bei dem die inVerbindung mit dem Flußdiagramm 400 beschriebenenVerarbeitungsschritte durchgeführtwerden können, umden Eingangsdatensatz zu verarbeiten. Andernfalls fährt dieSteuerung mit einem Schritt 606 fort, bei dem eine Bestimmunghinsichtlich dessen durchgeführtwird, ob eine Filterung bezüglichder separaten U- und/oder F-Spektren durchgeführt wird. Falls dies der Fallist, fährtdie Steuerung mit einem Schritt 608 fort, bei dem die Filterungvor Schritt 610 durchgeführt wird. Bei Schritt 610 wirdeine Bestimmung hinsichtlich dessen geführt, ob die Summierungstechnik,der erste oben beschriebene Ansatz, durchgeführt werden soll. Falls diesder Fall ist, fährtdie Steuerung mit einem Schritt 616 fort, bei dem ein U-und ein benachbartes F-Spektrum miteinander addiert werden. Beieinem Schritt 618 kann eine Filterung wahlweise bezüglich derkombinierten U-F-Spektren durchgeführt werden. Bei einem Schritt 620 werdendie Korrelation und weitere Verarbeitungsschritte, wie z. B. 406, 408, 410, 412 und 414,die in dem Flußdiagramm 400 beschriebensind, durchgeführt,was resultierende kombinierte U-F-Spektren erzeugt, die als einSatz A bezeichnet werden. Bei einem Schritt 622 werden diem/z-Werte, die in dem A-Spektrumidentifiziert werden, dann verwendet, um die ursprünglichenU-Spektren bei dem Abtastmaximum abzutasten, das für das Spektrumin dem Satz A identifiziert wird. Bei einem Schritt 624 werdenStammion-m/z-Werte als diejenigen bestimmt, die einen Intensitätswert > 0 aufweisen. Die Ab wesenheiteines Signals bei einem abgetasteten m/z-Wert, derart, daß die Intensität gleich0 ist, zeigt ein Fragmention an.
[0080] Wennbei Schritt 610 bestimmt wird, daß die Summierungstechnik nichtverwendet wird, wird der alternative zweite Ansatz, der Zeitkorrelationsansatz,verwendet. Bei einem Schritt 612 werden eine Korrelation undweitere Verarbeitungsschritte, wie z. B. 406, 408, 410, 412 und 414,die in dem Flußdiagramm 400 beschriebensind, separat bezüglichdes U- und des F-Spektrums durchgeführt. Bei Schritt 614 werdendie Stämmean entsprechende Fragmente unter Verwendung der Korrelation vonZeitschwerpunkten fürdie verarbeitete U- und F-Gruppe angepaßt.
[0081] Eswird darauf verwiesen, daß dasMassenspektrometer in dem abwechselnden Abtastmodus eine Abtastgeschwindigkeitverwenden kann, die sehr viel höherals die Geschwindigkeit ist, mit der Komponenten eluieren. Bei einemAusführungsbeispielz. B. ist die Abtastgeschwindigkeit um einen Faktor von 10 odermehr höherals die Geschwindigkeit, mit der Komponenten aus dem Massenspektrometereluieren. Ausgewählte Abtastgeschwindigkeitensind hierin an anderer Stelle beschrieben.
[0082] Wennder Eingangsdatensatz nur U-Spektren ohne Fragmente umfaßt, wirddie Analyse durchgeführt, umjedes Peptid in der Mischung oder Molekül in der Probe zu prüfen. JedeGruppe entspricht den geladenen Zuständen und Isotopen eines einzelnenPeptids oder Moleküls,die gleichzeitig koeluieren. Wenn der Eingangsdatensatz nur U-Spektrenumfaßt,könnendie hierin beschriebenen Techniken verwendet werden um zu bestimmen,welche m/z-Verhältnissevon Spitzen von dem gleichen Peptid oder Molekül sind. Dies kann ein nützlicherVorverarbeitungsschritt vor einem Durchführen von z. B. einer Ladungszuweisung,Isotopgruppierung, De-Novo-Sequenzierung,Datenbanksuche und dergleichen sein.
[0083] Wennder Eingangsdatensatz nur F-Spektren umfaßt, entspricht jede Gruppeden Ladungszuständen, Isotopenund Fragmenten eines einzelnen Peptids oder Moleküls, diegleichzeitig ko-eluieren.
[0084] Bezugnehmend auf 12 ist einFlußdiagramm 700 vonVerfahrensschritten eines exemplarischen Ausführungsbeispiels eines Cluster-oder Gruppierungsprozesses gezeigt. Die Verfahrensschritte des Flußdiagramms 700 können alsTeil der Verarbeitung von Schritt 410 durchgeführt werden.Die Eingabe bei einem Schritt 702 ist die KorrelationsmatrixC, erzeugt als ein Ergebnis der Verarbeitung aus Schritt 406.Bei Schritt 702 wird die Zeile „i" der Matrix C als die Zeile mit dergrößten Größe bestimmt.Die Größe einesVektors kann auf unterschiedliche Weisen definiert sein. Bei einemAusführungsbeispielz. B. kann die Größe als eine p-Norm eines Vektorsfür 1 <= p <= unendlich, wobeip ein Ganzzahlwert ist, füreinen Vektor x1 definiert sein, wie folgt:
[0085] DerVektor x kann „n" Werte umfassen,die jeweils echte oder komplexe Elemente sind. In dem Fall, in demp = unendlich gilt, trifft das Folgende zu:
[0086] EinAusführungsbeispielkann auch weitere Typen von Normen beim Bestimmen einer Größe verwenden,wie z. B. weitere Normen, die Ableitungen beinhalten, wie z. B.die Sobelev-Norm.Weitere Maßeder Größe, diein einem Ausführungsbeispielenthalten sein können,umfassen: eine Anzahl von Elementen oberhalb einer Schwelle, Entropie,Konzentration, Energielogarithmus und dergleichen, wie z. B. inWickhauser „AdaptedWavelet Analysis from Theory to Software" (Ange paßte Wavelet-Analyse von Theoriezu Software), 1994, A.K. Peters, Massachuetts und Atkinson „An Introductionto Numerical Analysis" (EineEinführungin die numerische Analyse), 1989, John Wiley & Sons, USA beschrieben ist.
[0087] Beieinem Schritt 704 wird eine Bestimmung durchgeführt, obdie Größe kleinerals eine erste Schwelle ist, oder ob alle Zeilen verarbeitet wurden.Wenn eine Bedingung zutrifft, stoppt die Verarbeitung. Andernfalls fährt dieSteuerung mit einem Schritt 706 fort, bei dem mit einerneuen Gruppe mit der ausgewähltenZeile „i", die in der neuenGruppe enthalten ist, begonnen wird. Eine Abtastung „S", bei der die Zeile „i" maximal ist, wird ebensobestimmt und als ein Kriterium zum Gruppieren nachfolgender Zeilenverwendet. Die erste Schwelle kann mit jedem Ausführungsbeispielvariieren und kann empirisch gemäß jedembestimmten Datensatz und Massenspektrometer-Einstellungen und -Charakteristikabestimmt werden. Bei einem Ausführungsbeispielz. B. kann die erste Schwelle 0,15 sein, die einen minimalen Korrelationswertspezifiziert. Wenn diese erste Schwelle erhöht wird, kann die Anzahl vonGruppen sinken. Bei einem Schritt 708 wird ein Zähler „j" auf den Wert „i + 1" initialisiert. Beieinem Schritt 710 wird eine Bestimmung durchgeführt, obdas gegenwärtigeElement, Cij, größer alseine zweite Schwelle ist, sowie, ob die Spitze der Zeile „j" innerhalb einerbestimmten Anzahl von Abtastungen (Schwelle 3) der Abtastung „S" (Spitzenabtastungfür dieZeile „i") ist. Bei einemAusführungsbeispielz. B. kann diese zweite Schwelle 0,75 und die dritte Schwelle gleichzwei Abtastungen sein. Wenn Cij größer als die Schwelle 2 istund die Abtastdifferenz kleiner als die Schwelle 3, fährt dieSteuerung mit einem Schritt 712 fort, bei dem die Zeilej zu der gegenwärtigenGruppe hinzugefügtwird, wenn die Zeile j nicht bereits berücksichtigt wurde. Bei einemSchritt 714 wird die Zeile j aus einer weiteren Betrachtungausgeschlossen und die Steuerung fährt mit einem Schritt 716 fort.Wenn bei Schritt 710 bestimmt wird, daß Cij nicht größer alsdie zweite Schwelle ist, fährtdie Steuerung direkt mit Schritt 716 fort.
[0088] Eswird darauf verwiesen, daß dieAuswahl der ersten Schwelle (Schwelle 1), wie bei Schritt 704 verwendetwird, und der zweiten Schwelle (Schwelle 2), wie bei Schritt 710 verwendetwird, ausgewähltsein kann, um die Qualitätder Gruppierungen der Zeilen zu verbessern und die Anzahl ungruppierterZeilen zu minimieren. Die Schwelle 1 kann gesenkt werden, um dieAnzahl ungruppierter Zeilen zu minimieren, und die Schwelle 2 kannerhöhtwerden, um die Qualitätder Gruppierung zu verbessern. Da eine Auswahl dieser beiden Schwellenvoneinander abhängigist, variiert der füreine ausgewählteWert bei einem Ausführungsbeispielmit dem anderen. Es wird angemerkt, daß die Auswahl der Schwelle3 bei jedem Ausführungsbeispielvariieren kann und als datenabhängiggekennzeichnet sein kann. Die Auswahl der Schwelle 3 kannz. B. abhängigvon der Abtastauflösungdurchgeführtwerden, d. h. wie viele Abtastungen über eine Chromatographiespitzeerfaßt werden.
[0089] BeiSchritt 716 wird eine Bestimmung durchgeführt, oballe Spalten in der Zeile „i" verarbeitet wurden. Fallsdies nicht der Fall ist, fährtdie Steuerung mit einem Schritt 718 fort, bei dem j um1 erhöhtwird, und die Steuerung fährtmit Schritt 710 fort, um das nächste Element in der gegenwärtigen Zeilezu prüfen.Wenn alle Spalten in der Zeile „i" verarbeitet wurden, fährt dieSteuerung mit Schritt 702 fort, bei dem die nächste Zeile „i" bestimmt wird.
[0090] Eswird darauf verwiesen, daß dieoben in Verbindung mit Schritt 704 beschriebene erste Schwelledie Anzahl von Zeilen der Korrelationsmatrix beeinflussen kann,die nicht in einer Gruppe enthalten sind. Die ungruppierten Zeilenkönnenz. B. Rauschen oder einzelne Spitzen umfassen, so daß ein Erhöhen derGrenzschwelle 1 die Anzahl gruppierter Zeilen reduziert und einRauschen in dem Datensatz vor einer Korrelation entfernt. UnterVerwendung des beispielhaften Ausführungsbeispiels eines in Verbindungmit 12 beschriebenenClusterns oder einer Gruppierung beeinflussen die erste und diezweite Schwelle in der Gruppierungs- oder Clusterverarbeitung dieAnzahl ungruppierter Zeilen. Die Schwelle 1 und die Schwelle 2 variierenbeide zwischen 0 und 1. Die erste Schwelle, Schwelle 1, ist dieSchwelle zum Auswähleneiner Zeile als gültigeDaten aufweisend und die zweite Schwelle, Schwelle 2, ist die Schwellezum Gruppieren einer Zeile mit einer weiteren. Die Schwelle 3 istdie maximale Trennung (in Abtastungen oder Sekunden), die zwischender Chromatographiespitze der Zeile und der Chromatographiespitzeder Samenzeile erlaubt ist.
[0091] Wasnun beschrieben wird, ist ein vereinfachtes Beispiel, bei dem diehierin beschriebenen Verfahrensschritte unter Verwendung eines Anfangsdatensatzesin Matrixform durchgeführtwerden. Bei dem folgenden Beispiel wird angenommen, daß keineFilterung vorliegt, die in Verbindung mit den Schritten 404 und 408 durchgeführt wird.Zusätzlichwird angemerkt, daß derhierin verwendete Datensatz kein typischer Datensatz ist, sonderneine kleine Abtastmatrix, die zu Darstellungszwecken einer Verwendunghierin beschriebener Techniken ausgewählt ist. Der Korrelationsschritt 406 undder Gruppierungs- oder Clusterschritt 410 werden nun unterVerwendung einer Datenmatrix B (8 × 8) durchgeführt. JedeZeile stellt ein Massenchromatogramm dar und jede Spalte stellteine Abtastung oder einen Zeitpunkt dar.
[0092] EineKorrelationsmatrix (8 × 8),C, wird als ein Ergebnis der Verarbeitung von Schritt 406 erzeugt.Die resultierende Matrix C ist wie folgt:
[0093] DieGruppierungs- oder Clusterschritte des Flußdiagramms 700 können durchgeführt werden,um bestimmte Zeilen der Korrelationsmatrix C miteinander zu gruppieren.Ein Gruppenindexvektor (Gruppe), der eine Anzahl von Einträgen gleichder Anzahl von Zeilen in der Korrelationsmatrix aufweist, kann verwendet werdenum anzuzeigen, welche Zeilen in der Korrelationsmatrix zu welchenGruppen gehören.Diese Anzeige kann durchgeführtwerden, indem eine Gruppenzahl in jedem Eintrag vorhanden ist, undder n-te Eintrag des Gruppenindexvektors identifiziert die Gruppenzahlder n-ten Reihe der Korrelationsmatrix.
[0094] Fortfahrendmit dem vorangegangenen Beispiel ist der zugeordnete Gruppenvektorwie folgt: Gruppe = 1 0 2 1 0 2 0 1
[0095] Umdies weiter darzustellen, kann die Korrelationsmatrix Cl gemäß den Bezeichnungenin dem zugeordneten Gruppenvektor neu geordnet werden, um die Naturdes Gruppierungsalgorithmus zu zeigen:
[0096] Bezugnehmend auf die 13 bis 17 sind beispielhafte graphischeAnzeigen eines Datensatzes an unterschiedlichen Punkten bei derVerarbeitung, wenn die Verfahrensschritte aus 10 durchgeführt werden, gezeigt. 13 zeigt einen Probe-Eingangsdatensatz 1000,der als ein Ergebnis der Verarbeitung aus Schritt 402 erzeugtwerden kann. Nach einem Filtern bei Schritt 404 kann derursprünglicheDatensatz wie in der beispielhaften Anzeige 1100 aus 14 dargestellt sein. Nachdem Korrelationsverarbeitungsschritt 406 kann die Korrelationsmatrixgraphisch als 1200 in 15 dargestelltsein. Nach einem Identifizieren von Gruppen oder Clustern durchein Durchführender Verfahrensschritte des Flußdiagramms 700 aus 11 können die resultierenden Gruppierungengraphisch durch ein Neuordnen der Korrelationsmatrix wie bei 1300 aus 6 dargestellt werden. Diegefilterten Daten könnengemäß dem Gruppenvektorgruppiert werden, der aus einem Durchführen der Schritte des Flußdiagramms 700 resultiert.
[0097] Diebeispielhafte Anzeige 1400 aus 17 stellt die neu geordneten m/z-Zeilendar, derart, daß m/z-Zeilenin der gleichen Gruppe benachbart zueinander sind. Nach einem Auswählen einesoder mehrerer relevanter Abtastungen für jede Gruppe können dieentsprechenden Intensitätenfür dieaus gewähltenAbtastungen aus dem gefilterten Datensatz erhalten werden, um einresultierendes Spektrum zu erzeugen. Bei einem hierin beschriebenenAusführungsbeispielkönnendie Abtastungen durch ein Finden der Abtastung oder der Zeit ausgewählt werden,bei der jede Gruppe den Korrelationswert maximiert, indem die Zeilender Datenmatrix fürjede Gruppe hinzugefügtwerden und die Abtastung mit dem maximalen Intensitätswert ausgewählt wird.
[0098] Dievorangegangenen hierin beschriebenen Verarbeitungstechniken können, z.B. in Verbindung mit dem Flußdiagramm 400,unter Umständenin Fällennicht verwendet werden, in denen zwei oder mehr Moleküle vorliegen,die gleichzeitig eluieren und auch das gleiche Elutionsprofil aufweisen.In diesem Fall sind die vorangegangenen Verarbeitungsschritte nichtin der Lage, die unterschiedlichen Peptide zu identifizieren und ordnungsgemäß Stamm(U-Spektren) mit Fragmenten (F-Spektren) zu paaren, wobei eine weitereVerarbeitungstechnik verwendet werden kann, wie z. B. in der US-Patentanmeldung Nr.10/388,088, eingereicht am 13. März2003 mit dem Titel „Methodsand Devices for Identifying Biopolymers Using Mass Spectroscopy" beschrieben ist,die im folgenden als „dieOffenbarung von Thompson und Fischer" bezeichnet wird. Die Verarbeitungsschrittevon Thompson und Fischer könnenbezüglichder Ergebnisse durchgeführtwerden, die durch die hierin beschriebene Verarbeitungsschritteerzeugt werden, um die Stamm-Fragment-Paarungen in Fällen aufzulösen, indenen zwei oder mehr Molekülegleichzeitig eluieren. Die Offenbarung von Thomson und Fischer beschreibtein Verfahren zum Sammeln von Strukturinformationen für Biopolymerein einer Probe durch ein Laufenlassen des Massenspektrometers indem abwechselnden Abtastmodus, wie hierin an anderer Stelle beschriebenist, mit abwechselnd U- und F-Spektren. Der abwechselnde Abtastmodussorgt fürein Nehmen eines ersten Spektrums (U-Spektrum) bei Normalenergiepegeln,derart, daß keineFragmentierung induziert wird, wobei dann eine nächste zweite Abtastung beihöherenFragmentierungsenergiepegeln (F-Spektrum) genommen wird, bei denenEnergie durch eine erhöhteSpannungsdifferenz zwischen Komponenten der Ionisierungsquelle,eine Frequenzstimulierung oder eine weitere Technik injiziert wird,die eine Sequenz abwechselnder Spektren erzeugt, die entfaltet oderzerlegt werden können,um die geeigneten Fragmentionen aus dem F-Spektrum dem geeignetenStamm in dem U-Spektrumzuzuordnen. Wenn ein Eingangsdatensatz verwendet wird, der Abwechslungsabtastmodusdatenumfaßt,kann die hierin beschriebene Technik ein Vorverarbeitungsschrittsein, der vor dem Verfahren durchgeführt wird, das in der Offenbarungvon Thomson und Fischer beschrieben ist, um den geeigneten Stammden Fragmenten (Paarungen von U- und F-Spektren) zuzuordnen. Eine Ladungszuweisung,eine Isotopgruppierung, eine De-Novo-Sequenzierung, eine Datenbanksucheund dergleichen könnennachfolgend durchgeführtwerden.
[0099] EinU-Spektrum umfaßtSpitzen, die einigen und vorzugsweise allen Polypeptiden in derProbe entsprechen, wenn diese Polypeptide unfragmentiert sind. EinU-Spektrum kann durch Erfassen der Polypeptide in der Probe ohneein Aussetzen derselben gegenübereinem Fragmentierungsmechanismus erhalten werden. Es wird angemerkt,daß einU-Spektrum in einigen AusführungsbeispielenSpitzen umfassen kann, die Fragmente dieser Polypeptide darstellen,z. B. Fragmente, die unbeabsichtigt als eine Folge des Mechanismuserzeugt wurden, der zur Ionisierung und/oder Erfassung der Polypeptidein dem Spektrometer verwendet wird.
[0100] EinF-Spektrum umfaßtSpitzen, die einer Sammlung von Fragmenten einiger und vorzugsweisealler Polypeptide in der Probe entsprechen. Ein F-Spektrum kanndurch ein Erfassen der Polypeptide in der Probe, nachdem dieselbengegenübereinem oder mehreren Fragmentierungsmechanismen ausgesetzt wurden,erhalten werden. Es wird darauf verwiesen, daß ein F-Spektrum bei einigenAusführungsbeispielenSpitzen umfassen kann, die unfragmentierte Polypeptide darstellen,z. B. Polypeptide, die eine Aussetzung gegenüber dem Fragmentierungsmechanismus überstehen.Es ist zu erkennen, daß derar tigeSituationen am wahrscheinlichsten auftreten, wenn die Polypeptiderelativ niedrigen Fragmentierungsenergien ausgesetzt werden.
[0101] Diehierin beschriebenen Verarbeitungstechniken können auch unter Verwendungvon Eingangsdatensätzenmit Mehrmodenchromatogrammen durchgeführt werden, die als Ionen oderSätze vonIonen mit dem gleichen m/z-Wert, jedoch unterschiedlichen chemischenZusammensetzungen, gekennzeichnet sind. Graphisch weist eine Mehrmodenkurvemehrere Spitzen auf, wie z. B. dann, wenn die Kurve 3 aus 9 mehrere Spitzen aufweisenwürde anstattnur die einzelne Spitze, wie in der Anzeige 350 gezeigtist. Ein zusätzlicherSchritt zu dem Flußdiagramm 10 kannverwendet werden, um Mehrmodenkurven, z. B. vor Schritt 406, zuerfassen, bei dem eine Korrelation durchgeführt wird. Falls die Mehrmodenkurvenbestimmt werden, wird eine zusätzlicheVerarbeitung bezüglichder Eingangsdatensätzedurchgeführt.Insbesondere wird eine zusätzlicheVerarbeitung vor dem Durchführenvon Schritt 406 und als Teil eines Aufbauens der resultierenden Spektrenbei Schritt 414 durchgeführt. Diese zusätzlicheund modifizierte Verarbeitung ist in den folgenden Absätzen beschrieben.
[0102] Mehrmodenspitzenkönnendurch ein Verwenden einer Spitzenfindungstechnik erfaßt werden,die bestimmt, daß einebestimmte Zeile des ursprünglichenEingangsdatensatzes mehrere Spitzen in einer einzelnen Kurve aufweist.Obwohl jede einer Vielzahl unterschiedlicher Techniken verwendetwerden kann, erfaßtein AusführungsbeispielSpitzen durch ein anfänglichesFiltern einer Zeile, so daß eineBasislinie entfernt wird, die bewirkt, daß Spitzen durch Null-Wertegetrennt sind. Ein Ende einer Spitze kann durch ein Finden der Abtastungbestimmt werden, bei der die erste Ableitung, die eine Steigungeiner Linie anzeigt, negativ ist. Wenn Mehrmodenkurven in einerbestimmten Zeile des Ursprungsdatensatzes bestimmt werden, bevorder Korrelationsschritt 406 durchgeführt wird, können die beiden Kurven z. B.durch ein Teilen der Zeile ursprünglicher Datenin mehrere Zeilen, nämlicheine fürjede zusätzlicheSpitze, getrennt werden. Die Zeile wird nach jeder Spitze in demChromatogramm geteilt. Die verbleibenden Einträge in jeder Zeile können mitNullen gefülltwerden. Alternativ kann ein Ausführungsbeispielweitere Techniken verwenden, wie z. B. eine Interpolation und Kurvenanpassungstechniken,um die verbleibenden Einträgeaufzufüllen.Es wird z. B. eine Zeile von Daten in der Ursprungsdatenmatrix,wie hierin beschrieben ist, wie folgt betrachtet:
[0103] EinAusführungsbeispielkann eine Mehrmodenerfassungs- und Korrekturtechnik umfassen, dieunter Verwendung von Hardware und/oder Software implementiert seinkann. Diese Zeilenteilung ermöglichtes, daß eineinzelnes Chromatogramm ein Teil mehrerer Gruppen sein kann.
[0104] Einweiteres Ausführungsbeispielkann die Verwendung von Bildverarbeitungsalgorithmen, wie z. B. desWasserscheiden algorithmus, umfassen, um eine Spitzenfindung in derZeit- und m/z-Dimensiongleichzeitig durchzuführen.Dieser Ansatz würdeden Bedarf nach einer Durchführungder zuvor genannten Technik einer Spitzenteilung durch ein Durchführen derSpitzenfindung vermeiden. Zusätzlichwürde erdazu dienen, den Datensatz in Spitzen zu partitionieren, wodurchdie Größe der Korrelationsmatrixreduziert wird. Dieser Algorithmus sowie weitere Bildverarbeitungstechnikensind in K.R. Castleman „DigitalImage Processing",Prentice-Hall Inc., New Jersey, 1996 beschrieben.
[0105] InVerbindung mit der Verarbeitung aus Schritt 414 zur Erzeugungeines resultierenden Spektrums wird wieder der ursprünglicheDatensatz verwendet. Insbesondere werden, wie hierin an andererStelle beschrieben ist, die geeigneten Spalten von Intensitäten für die ausgewählten Abtastungenaus dem ursprünglichenDatensatz erhalten. Mit Mehrmodendaten sollte angemerkt werden,daß einm/z-Bereich in mehr als einer Gruppe erscheinen kann.
[0106] EinAusführungsbeispielkann jeden unterschiedlicher Typen von Massenspektren verwenden,die z. B. durch ein Flugzeit-(TOF-)Massenspektrometererzeugt werden können.Ein beispielhaftes Ausführungsbeispielkann das Beinhalten eines Schritts nach Schritt 402 verwenden,bei dem Eingangsdatensätzein eine kompaktere Form umgewandelt werden, bevor sie mit den vorangegangenenVerarbeitungsschritten verwendet werden. Ein TOF-Datensatz kannz. B. umgewandelt werden, um mit den vorangegangenen Techniken verwendetzu werden. Der TOF-Eingangsdatensatz kann eine zweidimensionaleMatrix sein, bei der die Y-Achse die Flugzeit anzeigt, die direktmit den m/z-Werten korreliert ist, und die Elutionszeit auf derx-Achse gezeigt ist. Jede Spalte der TOF-Daten ist eine Abtastungder Massenspektraldaten. Diese Matrix kann in eine sparsamere Formumgewandelt werden, um eine Speicherung zu minimieren. Die bezüglich derMatrix verwendete Komprimierungstechnik kann gemäß der Funktionalität und bestimmtenKomponenten, die bei jedem Ausführungsbeispielenthal ten sind, variieren. Ein beispielhaftes Ausführungsbeispielverwendet eine MATLAB-Funktion zur Komprimierung der Matrix in einsparsameres Matrixformat. Alle erforderlichen nachfolgenden Umwandlungenkönnendurch MATLAB durchgeführtwerden. Ein Ausführungsbeispielkann wahlweise abhängig vonSpeichereinschränkungenund weiteren Charakteristika eines Ausführungsbeispiels weitere Formateverwenden.
[0107] EinAusführungsbeispielkann Filtertechniken verwenden, um Rauschen zu reduzieren und Daten,die bekannten Verunreinigungen zugeordnet sind, zu beseitigen. BestimmteKorrelationswerte einer bekannten Verunreinigung innerhalb einesbestimmten m/z-Bereichs könnenbei Schritt 408 beseitigt werden. Es wird z. B. der Fallbetrachtet, daß einebekannte Reinigungsmittel-Verunreinigung vorhanden sein kann. DasVorliegen einer Verunreinigung kann durch ein manuelles Prüfen einesKonturdiagramms und ein visuelles Lokalisieren eines konstantenHorizontalbandes, das bei allen Elutionszeiten vorliegt, bestimmtwerden. Eingangsdatensätzekönnengeprüftwerden, um automatisch auf bestimmte Verunreinigungen hin zu testenund entsprechend die Bändervon Daten zu entfernen. Es wird darauf verwiesen, daß ein exemplarischesAusführungsbeispielvorsehen kann, daß „Rauschen" gefiltert wird,das stark korreliert ist, wie z. B. eine bekannte Verunreinigung,und/oder schwach korreliert ist, wie z. B. eine Interferenz.
[0108] Eswird darauf verwiesen, daß diehierin beschriebenen Techniken zum Durchführen einer quantitativen Analyseanstelle einer Identifizierungsverarbeitung verwendet werden können, wiez. B. einem Identifizieren übereinstimmenderFund U-Spektren. Dies kann die zuvor beschriebenen Verarbeitungsschrittebeeinflussen. Wenn eine quantitative Analyse unter Verwendung dervorangegangenen Techniken durchgeführt wird, können ausgewählte interessierende Punkte,wie bei Schritt 412, diejenigen umfassen, die häufig über jede Gruppeabgetastet werden, anstatt ein einzelnes Maximum zu bestimmen, wiehierin beschrieben ist. Wie hierin an ande rer Stelle beschriebenist, erzeugt die Verarbeitung von Schritt 414 ein einzelnesSpektrum fürjedes Ion, wobei Verunreinigungen und andere ko-variierende Spektrenentfernt werden. Zur quantitativen Analyse unter Verwendung dervorangegangenen Techniken wird ein Spektrum für jedes Cluster oder jede Gruppeerzeugt. Zur Quantitation werden die Spitzenbereiche für die Gruppenchromatogrammeoder Zeilen integriert. Dies liefert einen Gruppenspitzenbereich,der füreine relative Quantitation mit anderen Gruppen in dem Datensatzverwendet werden kann. Zur Quantitation stellt jedes Cluster oderjede Gruppe unter Verwendung der vorangegangenen Techniken einenBereich von m/z-Werten und eine Elutionszeit dar, die ein verwandtesSignal enthält.
[0109] DasVorangegangene liefert Techniken, die sich die Tatsache zunutzemachen, daß bestimmteGruppierungen zu einer Ko-Varianzneigen. Stamm- und verwandte Ionenfragmente neigen dazu, zu ko-variieren und ähnlicheKo-Elutionsprofile aufzuweisen. Eingangsdaten, die nur U-Spektrenumfassen, können,wenn sie durch die hierin beschriebenen Techniken verarbeitet werden,verwendet werden, um Ladungszuständeund isotope einzelne Peptide zu gruppieren, da diese Ladungszustände undIsotope durch ein Ko-Eluieren zur gleichen Zeit ko-variieren. Eingangsdaten,die nur F-Spektren umfassen, könnenverwendet werden, um Ladungszustand, Isotope und Fragmente, diegleichzeitig ko-eluieren, zu gruppieren. Das Vorangegangene kannauch als ein Vorverarbeitungsschritt in Verbindung mit der Offenbarungvon Thomson und Fischer und weiteren Verarbeitungstechniken verwendetwerden, um U- und verwandte F-Spektren zu identifizieren, wenn zweiStamm- oder U-Spektreninnerhalb einer Gruppe das gleiche Elutionsprofil aufweisen undgleichzeitig ko-eluieren. Derartige weitere Techniken können z.B. Identifizierungsalgorithmen umfassen, wie z. B. SEQUEST, MASCOT, MSFITund dergleichen. Diese Techniken sind in der Technik bekannt. SEQUESTist z. B. in J. K. Eng; A. L. McCormack; J. R. Yates III J. Am.Soc. Mass Spectrom. 1994, 5, 976–989 beschrieben; MASCOT istin D.N. Perkins; D.J.C. Pappin; D.M. Creasy; J.S. Cottrell Electrophoresis1999, 20, 3551–3567beschrieben und MSFIT ist in K.R. Clauser, P.R. Baker und A.L. Burlingame,Role of accurate mass measurement (+/– 10 ppm) in protein identificationstrategies employing MS or MS/MS and database searching (Rolle einergenauen Massemessung (+/– 10ppm) bei Proteinidentifizierungsstrategien unter Verwendung vonMS oder MS/MS und Datenbanksuche), Analytical Chemistry, Bd. 71,14, 2871– (1999)beschrieben.
[0110] DieVerwendung der Offenbarung von Thomson und Fischer und/oder eineweitere Technik kann verwendet werden, um zwischen zwei unverwandtenKomponenten (keine Isotope, Ladungszustände oder Fragmente) zu unterscheiden,die koeluieren und exakt ko-variieren, da die hierin beschriebenenTechniken nicht in der Lage sind, zwischen zwei derartigen unverwandtenVerbindungen zu unterscheiden. Unterschiedliche Techniken können verwendetwerden, um das Vorliegen einer derartigen Bedingung zu bestimmen,die einen Bedarf anzeigt, alternative Techniken aufzurufen, um dieseStämmeihren entsprechenden Fragmenten zuzuweisen. Ein Ausführungsbeispielkann wie folgt extrahierte U-Spektren auf das Vorliegen mehrererStämme hintesten, zwischen denen die vorangegangenen Techniken nicht unterscheidenkönnen.Eine Isotoprückbildungund Ladungsentfaltung könnenbezüglichdes Spektrums durchgeführtwerden, was zu einem neutralen Massenspektrum (nicht m/z) führt. Diemehreren Isotopenverteilungen fürjeden Ladungszustand eines einzelnen Peptids oder einer Komponentewerden in eine einzelne Massenspitze zusammengebracht. Siehe M.W. Senko,S.C. Beu, F.W. McLafferty, J. Mass Spectrom, Bd. 6, 52– (1995).So resultiert, wenn zwei Peptide oder Komponenten in einem extrahiertenU-Spektrum vorhanden sind, diese Entfaltungsprozedur zu zwei Massenspitzen,die den Bedarf anzeigen, eine zusätzliche Verarbeitung aufzurufen,wie z. B: das Verfahren von Thomson und Fischer, um jeden Stamman seine zugeordneten Fragmentionen anzupassen.
[0111] DasVorangegangene liefert Techniken zum Analysieren der Chromatographieinformationeneines Datensatzes, wie z. B. eines LC/MS-Datensatzes, zur Trennungverwandter Ionen zur nachfolgenden Analyse in Spektren, die einzelneVerbindungen darstellen und die spezifischen Spektren identifizieren,die maximale Signalpegel liefern. Zusätzlich entfernt das VorangegangeneRauschen aus dem Datensatz, da Rauschen nicht dazu neigt, mit denrealen Datensignalen zu kovariieren. Konstante Signale, die ausVerunreinigungen resultieren, neigen ebenso nicht dazu, mit denrealen Datensignalen zu ko-variieren, und können ebenfalls herausfallen.Da Rauschen unter Verwendung der vorangegangenen Techniken zusätzlich zuspezifischen angewendeten Filterungstechniken entfernt wird, z.B. bei der Verarbeitung aus Schritt 404, kann die Leistungeiner nachfolgenden Verarbeitung, wie z. B. einer De-Novo-Sequenzierung,wesentlich verbessert werden. Das Vorangegangene kann auch zu einerReduzierung der Größe und Komplexität einesEingangsdatensatzes führen,der bei einer nachfolgenden Verarbeitung verwendet wird. Die vorangegangenenTechniken könnenbei der Proteinidentifizierung verwendet werden, können jedochauch auf andere Klassen von Molekülen angewendet werden, die ähnlicheCharakteristika teilen, wie z. B. Polynukleotide, Polysacharideund weitere kleine Moleküle.
权利要求:
Claims (40)
[1] Verfahren zum Identifizieren verwandter Ionenin einem Eingangsdatensatz (350), der durch ein Analysiereneiner Probe (12) erzeugt wird, mit folgenden Schritten: Korrelieren(406) jeder Zeile von Daten in einem Eingangsdatensatzmit jeder weiteren Zeile von Daten in dem Eingangsdatensatz, waseine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über derZeit füreinen bestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobeijedes Element der Korrelationsmatrix einen Korrelationswert umfaßt und einenzugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, dieidentifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswertzugeordnet sind; Gruppieren (410) der Korrelationsmatrix,was zumindest eine Gruppe und zumindest eine Zeile der Korrelationsmatrixals in der zumindest einen Gruppe befindlich identifiziert, wobeijede Gruppe ko-variierende Chromatogramme darstellt; Auswählen (412)zumindest eines interessierenden Zeitraums für jede Gruppe; und Erzeugen(414) eines resultierenden Spektrums für jede Gruppe durch ein Abtastenvon Chromatogrammen, die in jeder der Gruppe enthalten sind, zujedem des zumindest einen interessierenden Zeitraums der Verwendungeiner Form des Eingangsdatensatz.
[2] Verfahren gemäß Anspruch1, das ferner folgenden Schritt aufweist: Filtern des Eingangsdatensatz(350) vor einem Durchführender Korrelation.
[3] Verfahren gemäß Anspruch1 oder 2, bei dem der Eingangsdatensatz (350) nur eineseines unfragmentierten Spektrums, eines fragmentierten Spektrumsund eines abwechselnd unfragmentierten und fragmentierten Spektrumsumfaßt.
[4] Verfahren gemäß Anspruch3, bei dem der Eingangsdatensatz nur abwechselnd unfragmentierteund fragmentierte Spektren umfaßt,wobei das Verfahren ferner folgende Schritte aufweist: Bilden(616) eines kombinierten Spektrums, das ein unfragmentiertesSpektrum und ein verwandtes fragmentiertes Spektrum umfaßt; Durchführen desKorrelierens, des Gruppierens, des Auswählens und des Erzeugens (620)unter Verwendung des kombinierten Spektrums; Bestimmen vonm/z-Werten in dem kombinierten Spektrum; Abtasten (622)der unfragmentierten Spektren bei den m/z-Werten in dem kombiniertenSpektrum bei einem Abtastmaximum, das für das kombinierte Spektrumidentifiziert wird; und Bestimmen (624), daß ein abgetasteterm/z-Wert in den kombinierten Spektren einem Stamm zugeordnet ist, wenneine Intensitätbei dem abgetasteten m/z-Wert vorliegt, und Bestimmen, daß der abgetastetem/z-Wert in den kombinierten Spektren einem Fragment zugeordnetist, wenn kein Signal bei dem abgetasteten m/z-Wert vorliegt.
[5] Verfahren gemäß Anspruch3, bei dem der Eingangsdatensatz nur abwechselnd unfragmentierteund fragmentierte Spektren umfaßt,wobei das Verfahren ferner folgende Schritte aufweist: Durchführen (612)des Korrelierens, des Gruppierens, des Auswählens und des Erzeugens unterseparater Verwendung jedes des unfragmentierten Spektrums und desfragmentierten Spektrums; und Überprüfen (614) jedes Stammsdes unfragmentierten Spektrums auf Übereinstimmung mit verwandtenFragmenten in dem fragmentierten Spektrum durch ein Bestimmen, welcheder verwandten Fragmente mit dem Stamm kovariieren.
[6] Verfahren gemäß einemder Ansprüche1 bis 5, bei dem das Gruppieren ferner folgende Schritte aufweist: Bestimmen(702) einer ersten Zeile der Korrelationsmatrix, die einElement umfaßt,das einen maximalen Korrelationswert aller Korrelationswerte inder Korrelationsmatrix aufweist, die als zu gruppierende Kandidatenbetrachtet werden; Bestimmen (706) einer Zeitabtastung,die der ersten Zeile zugeordnet ist; für jedes Element der erstenZeile, das einer eindeutigen Paarung einer Zeile „i" und einer Spalte „j" entspricht, Bestimmen(710), ob ein Korrelationswert größer als ein vorbestimmter Wertist, und Bestimmen, ob eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalbeiner Schwellenzahl von Abtastungen der Zeitabtastung ist, die derersten Zeile zugeordnet ist; und wenn das Element größer alsder vorbestimmte Wert ist und wenn eine Abtastzahl, bei der dieZeile „j" maximal ist, innerhalbeiner Schwellenzahl von Abtastungen der Zeitabtastung ist, die derersten Zeile zugeordnet ist, Hinzufügen (712) einer Zeiledes Eingangsdaten satzes zu einer gegenwärtigen Gruppe, wobei die hinzugefügte Zeileeine Zeilenzahl aufweist, die gleich der eines Spaltenindex „j" ist, der dem Elementzugeordnet ist, und Ausschließen(714) der hinzugefügtenZeile aus einer weiteren Betrachtung als einer der Kandidaten zur Gruppierung.
[7] Verfahren gemäß Anspruch6, das ferner folgenden Schritt aufweist: Durchführen desBestimmens einer ersten Zeile, wenn ein Korrelationswert größer alsein vorbestimmter Wert ist und wenn eine Abtastzahl, bei der dieZeile „j" maximal ist, innerhalbeiner Schwellenzahl von Abtastungen der Zeitabtastung ist, die derersten Zeile zugeordnet ist, fürjedes Element der ersten Zeile, das einen zugeordneten Spaltenindexaufweist, der größer alsein Index ist, der der ersten Zeile zugeordnet ist.
[8] Verfahren gemäß Anspruch7, das ferner folgenden Schritt aufweist: Stoppen (704)einer Bildung von Gruppen durch das Gruppieren, wenn der maximaleKorrelationswert kleiner als ein vorbestimmter Wert ist.
[9] Verfahren gemäß Anspruch8, das ferner folgenden Schritt aufweist: Bilden (706)einer neuen Gruppe mit einer Auswahl einer nachfolgenden Zeile,die ein Element umfaßt,das einen maximalen Korrelationswert aller Korrelationswerte inder Korrelationsmatrix aufweist, die als zu gruppierende Kandidatenbetrachtet werden.
[10] Verfahren gemäß einemder Ansprüche3 bis 9, bei dem der Eingangsdatensatz (350) nur abwechselnd unfragmen tierteund fragmentierte Spektren umfaßt,wobei der Eingangsdatensatz zumindest zwei Komponenten umfaßt, diegleichzeitig eluieren und ein gleiches Elutionsprofil aufweisen,wobei das Verfahren ferner folgende Schritte aufweist: Kombinierenbenachbarter fragmentierter und unfragmentierter Spektren, was zueinem neuen kombinierten Datensatz führt, der die Hälfte derAnzahl von Spektren im Vergleich zu einer Gesamtzahl von Spektrender fragmentierten und unfragmentierten Spektren umfaßt; Erzeugeneines ersten resultierenden Spektrums und eines zweiten resultierendenSpektrums, wobei das erste resultierende Spektrum dem unfragmentiertenSpektrum zu einem ausgewähltenZeitpunkt entspricht und das zweite resultierende Spektrum dem fragmentiertenSpektrum zu dem ausgewähltenZeitpunkt entspricht; und Durchführen einer Verarbeitung, umzu identifizieren, welche der zumindest zwei Komponenten ein Stammist, der zumindest einem Fragment zugeordnet ist, das in dem fragmentiertenSpektrum enthalten ist.
[11] Verfahren gemäß einemder Ansprüche3 und 6 bis 9, bei dem der Eingangsdatensatz (350) nurein unfragmentiertes Spektrum umfaßt, wobei die zumindest eineGruppe, die durch das Gruppieren gebildet wird, Ladungszustände undIsotope einer einzelnen Komponente identifiziert, die gleichzeitigko-eluieren.
[12] Verfahren gemäß einemder Ansprüche3 und 6 bis 9, bei dem der Eingangsdatensatz (350) nurein fragmentiertes Spektrum umfaßt, wobei die zumindest eineGruppe, die durch das Gruppieren gebildet wird, Ladungszustände, Isotopeund Fragmente einer einzelnen Komponente identifiziert, die gleichzeitigko-eluieren.
[13] Verfahren gemäß einemder Ansprüche1 bis 12, bei dem das Auswählenvon interessierenden Zeiträumenfolgende Schritte umfaßt: Zusammenzählen vonIntensitätenextrahierter Chromatogramme fürjede Gruppe an jedem Abtastpunkt; und Bestimmen einer maximalenIntensitätfür jedeGruppe bei einem bestimmten Abtastpunkt, wobei das Erzeugeneines resultierenden Spektrums folgenden Schritt umfaßt: Abtastenextrahierter Chromatogramme jeder Gruppe an dem bestimmten Abtastpunkt.
[14] Verfahren gemäß einemder Ansprüche1 bis 13, bei dem der Eingangsdatensatz (350) unter Verwendungeines Massenspektrometers erzeugt wird, das die Probe analysiert.
[15] Verfahren gemäß einemder Ansprüche1 bis 14, bei dem der Eingangsdatensatz zumindest eine Mehrmodenspitzeeines extrahierten Ionenchromatogramms umfaßt, wobei eine Anzahl von Spitzenin der Mehrmodenspitze als „n" dargestellt wird,wobei das Verfahren ferner folgende Schritte aufweist: Bestimmenzumindest eines Teilungspunktes in der Mehrmodenspitze, um die Mehrmodenspitzein Abschnitte zu unterteilen; Zuteilen einer ersten Zeile desEingangsdatensatzes, der der Mehrmodenspitze entspricht, in Zeilenabschnitte gemäß dem zumindesteinen Teilungspunkt; Erzeugen von zusätzlichen „n – 1" Zeilen von Daten, die in dem Eingangsdatensatzenthalten sind, wobei jede zusätzlicheZeile einen unterschiedlichen der Zeilenabschnitte umfaßt; Entfernenaller Zeilenabschnitte, die in den zusätzlichen Zeilen enthalten sind,aus der ersten Zeile; und Füllenverbleibender Elemente jeder der zusätzlichen Zeilen und der erstenZeile.
[16] Verfahren gemäß einemder Ansprüche1 bis 15, das ferner folgenden Schritt aufweist: Filtern desEingangsdatensatzes, was einen gefilterten Datensatz erzeugt, wobeidie Form des Eingangsdatensatzes der gefilterte Datensatz ist.
[17] Verfahren gemäß einemder Ansprüche10 bis 16, bei dem zumindest zwei Ionen zwei Stammionen sind, diegleichzeitig ko-eluieren, die das gleiche Elutionsprofil aufweisenund ko-variieren, wobei das Verfahren ferner folgenden Schritt aufweist: Durchführen weitererVerarbeitungsschritte, um jedes der zwei Stammionen entsprechendenFragmentionen zuzuordnen.
[18] Verfahren gemäß einemder Ansprüche10 bis 17, bei dem die zumindest zwei Komponenten Stamm-Peptidesind, die gleichzeitig ko-eluieren und ähnliche Elutionsprofile zeigen,wobei das Verfahren ferner folgende Schritte aufweist: Bestimmen,daß einezusätzlicheVerarbeitung benötigtwird, um jedes der zumindest zwei Stamm-Peptide an zugeordnete Kind-Fragmenteanzupassen; und Durchführender zusätzlichenVerarbeitung.
[19] Verfahren gemäß einemder Ansprüche10 bis 17, bei dem die zumindest zwei Komponenten Peptide sind.
[20] Verfahren zum Quantifizieren zumindest eines Ionsin einem Eingangsdatensatz (350), der durch ein Analysiereneiner Probe (12) erzeugt wird, mit folgenden Schritten: Korrelierenjeder Zeile von Daten in einem Eingangsdatensatz mit jeder weiterenZeile von Daten in dem Eingangsdatensatz, was eine Korrelationsmatrixerzeugt, wobei jede Zeile Intensitäten über der Zeit für einenbestimmten Masse-Ladung-Bereich (m/z-Bereich) darstellt, wobei jedesElement der Korrelationsmatrix einen Korrelationswert umfaßt und einenzugeordneten Zeilen- und einen Spaltenidentifizierer aufweist, dieidentifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswertzugeordnet sind; Gruppieren der Korrelationsmatrix, was zumindesteine Gruppe und zumindest eine Zeile der Korrelationsmatrix alsin der zumindest einen Gruppe befindlich identifiziert, wobei jedeGruppe chemisch verwandte Komponenten darstellt, die ein korreliertesChromatographieverhalten zeigen; Auswählen zumindest eines interessierendenZeitraums fürjede Gruppe; und Erzeugen eines resultierenden Spektrums für jede Gruppedurch ein Abtasten von Chromatogrammen, die in jeder der Gruppenenthalten sind, zu jedem des zumindest einen interessierenden Zeitraumsder Verwendung einer Form des Eingangsdatensatzes.
[21] Computerprogrammprodukt zum Identifizieren verwandterIonen in einem Eingangsdatensatz (350), der durch ein Analysiereneiner Probe (12) erzeugt wird, mit folgenden Merkmalen: einemmaschinenausführbarenCode, der jede Zeile von Daten in einem Eingangsdatensatz mit jederweiteren Zeile von Daten in dem Eingangsdatensatz korreliert, waseine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über derZeit füreinen bestimmten Masse-Ladung-Bereich(m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrixeinen Korrelationswert umfaßtund einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist,die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswertzugeordnet sind; einem maschinenausführbaren Code, der die Korrelationsmatrixgruppiert, was zumindest eine Gruppe und zumindest eine Zeile derKorrelationsmatrix als in der zumindest einen Gruppe befindlichidentifiziert, wobei jede Gruppe ko-variierende Chromatogramme darstellt; einemmaschinenausführbarenCode, der zumindest einen interessierenden Zeitraum für jede Gruppeauswählt;und einem maschinenausführbarenCode, der ein resultierendes Spektrum für jede Gruppe durch ein Abtastenvon Chromatogrammen, die in jeder der Gruppen enthalten sind, zujedem des zumindest einen interessierenden Zeitraums der Verwendungeiner Form des Eingangsdatensatzes erzeugt.
[22] Computerprogrammprodukt gemäß Anspruch 21, das ferner folgendesMerkmal aufweist: einen maschinenausführbaren Code, der den Eingangsdatensatz(350) vor einem Durchführender Korrelation filtert.
[23] Computerprogrammprodukt gemäß Anspruch 21 oder 22, beidem der Eingangsdatensatz nur eines eines unfragmentierten Spektrums,eines fragmentierten Spektrums und eines abwechselnd unfragmentierten undfragmentierten Spektrums umfaßt.
[24] Computerprogrammprodukt gemäß Anspruch 23, bei dem derEingangsdatensatz (350) nur abwechselnd unfragmentiertenund fragmentierte Spektren umfaßt,wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist: einenmaschinenausführbarenCode, der ein kombiniertes Spektrum bildet (616), das einunfragmentiertes Spektrum und ein verwandtes fragmentiertes Spektrumumfaßt,wobei der maschinenausführbareCode, der korreliert, gruppiert, auswählt und erzeugt, das kombinierteSpektrum verwendet; einen maschinenausführbaren Code, der m/z-Wertein dem kombinierten Spektrum bestimmt; einen maschinenausführbarenCode, der die unfragmentierten Spektren bei den m/z-Werten in demkombinierten Spektrum bei einem Abtastmaximum, das für das kombinierteSpektrum identifiziert ist, abtastet (622); und einenmaschinenausführbarenCode, der bestimmt (624), daß ein abgetasteter m/z-Wertin den kombinierten Spektren einem Stamm zugeordnet ist, wenn eineIntensitätbei dem abgetasteten m/z-Wert vorliegt, und bestimmt, daß der abgetastetem/z-Wert in den kombinierten Spektren einem Fragment zugeordnetist, wenn kein Signal bei dem abgetasteten m/z-Wert vorliegt.
[25] Computerprogrammprodukt gemäß Anspruch 23, bei dem derEingangsdatensatz nur abwechselnd unfragmentierte und fragmentierteSpektren umfaßt,wobei der maschinenausführbareCode, der korreliert, gruppiert, auswählt und erzeugt, separat jedesdes unfragmentierten Spektrums und des fragmentierten Spektrumsverwendet, wobei das Computerprogrammprodukt ferner folgendes Merkmalaufweist: einen maschinenausführbaren Code, der jeden Stammdes unfragmentierten Spektrums auf Übereinstimmung mit verwandtenFragmenten in dem fragmentierten Spektrum durch ein Bestimmen, welcheder verwandten Fragmente mit dem Stamm ko-variieren, überprüft.
[26] Computerprogrammprodukt gemäß einem der Ansprüche 21 bis25, bei dem das Gruppieren ferner folgende Merkmale aufweist: einenmaschinenausführbarenCode, der eine erste Zeile der Korrelationsmatrix bestimmt (702),die ein Element umfaßt,das einen maximalen Korrelationswert aller Korrelationswerte inder betrachteten Korrelationsmatrix aufweist, die als zu gruppierendeKandidaten betrachtet werden; einen maschinenausführbarenCode, der eine Zeitabtastung bestimmt (706), die der erstenZeile zugeordnet ist; einen maschinenausführbaren Code, der für jedesElement der ersten Zeile, das einer eindeutigen Paarung einer Zeile „i" und einer Spalte „j" entspricht, bestimmt(710), ob ein Korrelationswert größer als ein vorbestimmter Wertist, und bestimmt, ob eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalbeiner Schwellenzahl von Abtastungen der Zeitabtastung ist, die derersten Zeile zugeordnet ist; und einen maschinenausführbarenCode, der, wenn das Element größer alsder vorbestimmte Wert ist und wenn eine Abtastzahl, bei der dieZeile „j" maximal ist, innerhalbeiner Schwellenzahl von Abtastungen der Zeitabtastung ist, die derersten Zeile zugeordnet ist, eine Zeile des Eingangsdatensatzeszu einer gegenwärtigen Gruppehinzufügt,wobei die hinzugefügteZeile eine Zeilenzahl aufweist, die gleich der eines Spaltenindex „j" ist, der dem Elementzugeordnet ist, und die hinzugefügteZeile aus einer weiteren Betrachtung als einer der Kandidaten zurGruppierung ausschließt.
[27] Computerprogrammprodukt gemäß Anspruch 26, das ferner folgendesMerkmal aufweist: einen maschinenausführbaren Code, der die ersteZeile bestimmt, wenn ein Korrelationswert größer als ein vorbestimmter Wertist und wenn eine Abtastzahl, bei der die Zeile „j" maximal ist, innerhalb einer Schwellenzahlvon Abtastungen der Zeitabtastung ist, die der ersten Zeile zugeordnetist, fürjedes Element der ersten Zeile, das einen zugeordneten Spaltenindexaufweist, der größer alsein Index ist, der der ersten Zeile zugeordnet ist.
[28] Computerprogrammprodukt gemäß Anspruch 27, das ferner folgendesMerkmal aufweist: einen maschinenausführbaren Code, der eine Bildungvon Gruppen durch das Gruppieren stoppt (704), wenn dermaximale Korrelationswert kleiner als ein vorbestimmter Wert ist.
[29] Computerprogrammprodukt gemäß Anspruch 28, das ferner folgendesMerkmal aufweist: einen maschinenausführbaren Code, der eine neueGruppe mit einer Auswahl einer nachfolgenden Zeile bildet (706),die ein Element umfaßt,das einen maximalen Korrelationswert aller Korrelationswerte inder Korrelationsmatrix aufweist, die als zu gruppierende Kandidatenbetrachtet werden.
[30] Computerprogrammprodukt gemäß einem der Ansprüche 23 bis29, bei dem der Eingangsdatensatz (350) nur abwechselndunfragmentierte und fragmentierte Spektren umfaßt, wobei der Eingangsdatensatzzumindest zwei Komponenten umfaßt,die gleichzeitig eluieren und ein gleiches Elutionsprofil aufweisen,wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist: einenmaschinenausführbarenCode, der benachbarte fragmentierte und unfragmentierte Spektrenkombiniert, was zu einem neuen kombinierten Datensatz führt, derdie Hälfteder Anzahl von Spektren im Vergleich zu einer Gesamtzahl von Spektrender fragmentierten und unfragmentierten Spektren umfaßt; einenmaschinenausführbarenCode, der ein erstes resultierendes Spektrum und ein zweites resultierendes Spektrumerzeugt, wobei das erste resultierende Spektrum dem unfragmentiertenSpektrum zu einem ausgewähltenZeitpunkt entspricht und das zweite resultierende Spektrum dem fragmentiertenSpektrum zu dem ausgewähltenZeitpunkt entspricht; und einen maschinenausführbarenCode, der eine Verarbeitung durchführt, um zu identifizieren,welche der zumindest zwei Komponenten ein Stamm ist, der dem zumindesteinen Fragment zugeordnet ist, das in dem fragmentierten Spektrumenthalten ist.
[31] Computerprogrammprodukt gemäß einem der Ansprüche 23 und26 bis 29, bei dem der Eingangsdatensatz (350) nur einunfragmentiertes Spektrum umfaßt,wobei die zumindest eine Gruppe, die durch das Gruppieren gebildetist, Ladungszuständeund Isotope einer einzelnen Komponente identifiziert, die gleichzeitigko-eluieren.
[32] Computerprogrammprodukt gemäß einem der Ansprüche 23 und26 bis 29, bei dem der Eingangsdatensatz (350) nur einfragmentiertes Spektrum umfaßt,wobei die zumindest eine Gruppe, die durch das Gruppieren gebildetist, Ladungszustände,Isotope und Fragmente einer einzelnen Komponente identifiziert,die gleichzeitig koeluieren.
[33] Computerprogrammprodukt gemäß einem der Ansprüche 21 bis32, bei dem das Auswählenvon interessierenden Zeiträumenfolgende Merkmale umfaßt: einenmaschinenausführbarenCode, der Intensitätenextrahierter Chromatogramme fürjede Gruppe zu jedem Abtastpunkt zusammenzählt; und einen maschinenausführbarenCode, der eine maximale Intensitätfür jedeGruppe zu einem bestimmten Abtastpunkt bestimmt, wobei das Erzeugeneines resultierenden Spektrums folgendes Merkmal umfaßt: einenmaschinenausführbarenCode, der extrahierte Chromatogramme jeder Gruppe zu dem bestimmtenAbtastpunkt abtastet.
[34] Computerprogrammprodukt gemäß einem der Ansprüche 21 bis33, bei dem der Eingangsdatensatz (350) unter Verwendungeines Massenspektrometers, das die Probe analysiert, erzeugt wird.
[35] Computerprogrammprodukt gemäß einem der Ansprüche 21 bis34, bei dem der Eingangsdatensatz zumindest eine Mehrmodenspitzeumfaßt,wobei der Eingangsdatensatz zumindest eine Mehrmodenspitze einesextrahierten Ionenchromatogramms umfaßt, wobei eine Anzahl von Spitzenin der Mehrmodenspitze als „n" dargestellt ist,wobei das Computerprogrammprodukt ferner folgende Merkmale aufweist: einenmaschinenausführbarenCode, der zumindest einen Teilungspunkt in der Mehrmodenspitze bestimmt, umdie Mehrmodenspitze in Abschnitte zu unterteilen; einen maschinenausführbarenCode, der eine erste Zeile des Eingangsdatensatzes, der der Mehrmodenspitze entspricht,in Zeilenabschnitte gemäß dem zumindesteinen Teilungspunkt zuteilt; einen maschinenausführbarenCode, der zusätzliche „n – 1" Zeilen von Datenerzeugt, die in dem Eingangsdatensatz enthalten sind, wobei jedezusätzlicheZeile einen unterschiedlichen der Zeilenabschnitte umfaßt; einenmaschinenausführbarenCode, der alle Zeilenabschnitte, die in den zusätzlichen Zeilen enthalten sind, ausder ersten Zeile entfernt; und einen maschinenausführbarenCode, der verbleibende Elemente jeder der zusätzlichen Zeilen und der ersten Zeilefüllt.
[36] Computerprogrammprodukt gemäß einem der Ansprüche 21 bis35, das ferner folgendes Merkmal aufweist: einen maschinenausführbarenCode, der den Eingangsdatensatz filtert, was einen gefilterten Datensatzerzeugt, wobei die Form des Eingangsdatensatz der gefilterte Datensatzist.
[37] Computerprogrammprodukt gemäß einem der Ansprüche 30 bis36, bei dem zumindest zwei Ionen zwei Stammionen sind, die gleichzeitigko-eluieren, die ein gleiches Elutionsprofil aufweisen und ko-variieren, wobeidas Computerprogrammprodukt ferner folgendes Merkmal aufweist: einenmaschinenausführbarenCode, der weitere Verarbeitungsschritte durchführt, um jedes der zwei Stammionenentsprechenden Fragmentionen zuzuordnen.
[38] Computerprogrammprodukt gemäß einem der Ansprüche 30 bis37, bei dem die zumindest zwei Komponenten Stamm-Peptide sind, die gleichzeitig ko-eluierenund ähnlicheElutionsprofile zeigen, wobei das Computerprogrammprodukt fernerfolgende Merkmale aufweist: einen maschinenausführbarenCode, der bestimmt, daß einezusätzlicheVerarbeitung benötigtwird, um jedes der zumindest zwei Stamm-Peptide an zugeordnete Kind-Fragmente anzupassen;und einen maschinenausführbarenCode, der die zusätzlicheVerarbeitung durchführt.
[39] Computerprogrammprodukt gemäß einem der Ansprüche 29 bis37, bei dem die zumindest zwei Komponenten Peptide sind.
[40] Computerprogrammprodukt zum Quantifizieren zumindesteines Ions in einem Eingangsdatensatz, der durch ein Analysiereneiner Probe (12) erzeugt wird, mit folgenden Merkmalen: einemmaschinenausführbarenCode, der jede Zeile von Daten in einem Eingangsdatensatz mit jederweiteren Zeile von Daten in dem Eingangsdatensatz korreliert, waseine Korrelationsmatrix erzeugt, wobei jede Zeile Intensitäten über derZeit füreinen bestimmten Masse-Ladung-Bereich(m/z-Bereich) darstellt, wobei jedes Element der Korrelationsmatrixeinen Korrelationswert umfaßtund einen zugeordneten Zeilen- und einen Spaltenidentifizierer aufweist,die identifizieren, welche Zeilen in dem Eingangsdatensatz dem Korrelationswertzugeordnet sind; einem maschinenausführbaren Code, der die Korrelationsmatrixgruppiert, was zumindest eine Gruppe und zumindest eine Zeile derKorrelationsmatrix als in der zumindest einen Gruppe befindlichidentifiziert, wobei jede Gruppe chemisch verwandte Komponentendarstellt, die ein korreliertes Chromatographieverhalten zeigen; einemmaschinenausführbarenCode, der zumindest einen interessierenden Zeitraum für jede Gruppeauswählt;und einem maschinenausführbarenCode, der ein resultierendes Spektrum für jede Gruppe durch ein Abtastenvon Chromatogrammen, die in jeder der Gruppen enthalten sind, zujedem des zumindest einen interessierenden Zeitraums der Verwendungeiner Form des Eingangsdatensatzes erzeugt.
类似技术:
公开号 | 公开日 | 专利标题
JP6272610B2|2018-01-31|生成イオンスペクトルのデータ独立取得および参照スペクトルライブラリ照合
US10466230B2|2019-11-05|Systems and methods for discovery and analysis of markers
EP3123495B1|2019-11-13|Filtrierung mit hoher massengenauigkeit zur verbesserten spektrumsabgleichung von daten aus hochauflösender gaschromatographie-massenspektrometrie mit referenzdatenbanken der einheitsauflösung
US5175430A|1992-12-29|Time-compressed chromatography in mass spectrometry
CN101534933B|2013-03-27|关于n维数据的离子检测和参数估计
JP4275864B2|2009-06-10|化学品混合物中の化合物を同定する方法
CA2298181C|2006-09-19|Non-targeted complex sample analysis
US8068987B2|2011-11-29|Method and system for profiling biological systems
JP4515819B2|2010-08-04|質量分析システム
CA2723928C|2013-06-11|Ms/ms data processing
US6906320B2|2005-06-14|Mass spectrometry data analysis techniques
JP4818116B2|2011-11-16|メタボノミクスにおいてlc−msまたはlc−ms/msデータの処理を行うための方法およびデバイス
JP4594154B2|2010-12-08|少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム
US7197402B2|2007-03-27|Determination of molecular structures using tandem mass spectrometry
JP5393449B2|2014-01-22|質量スペクトルデータの解析
JP5008564B2|2012-08-22|混合物中のタンパク質を同定する方法および装置
US9312110B2|2016-04-12|System and method for grouping precursor and fragment ions using selected ion chromatograms
JP4843250B2|2011-12-21|質量分析を用いた物質の同定方法
EP2652493B1|2019-05-08|Korrelierende vorläufer- und produktionen bei der gesamtionenfragmentierung
EP2016612B1|2019-07-03|Massenspektrometer
Zimmer et al.2006|Advances in proteomics data analysis and display using an accurate mass and time tag approach
US9791424B2|2017-10-17|Use of windowed mass spectrometry data for retention time determination or confirmation
US7087896B2|2006-08-08|Mass spectrometric quantification of chemical mixture components
McDonnell et al.2011|Imaging mass spectrometry data reduction: automated feature identification and extraction
US6873915B2|2005-03-29|Peak selection in multidimensional data
同族专利:
公开号 | 公开日
US7457708B2|2008-11-25|
US7279679B2|2007-10-09|
GB2403342A|2004-12-29|
DE102004015018B4|2008-12-18|
GB2403342B|2006-07-05|
US20050288872A1|2005-12-29|
GB0414114D0|2004-07-28|
US20040181351A1|2004-09-16|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2005-01-20| OP8| Request for examination as to paragraph 44 patent law|
2007-10-04| 8127| New person/name/address of the applicant|Owner name: AGILENT TECHNOLOGIES, INC. (N.D.GES.D. STAATES, US |
2009-06-10| 8364| No opposition during term of opposition|
2011-01-20| 8339| Ceased/non-payment of the annual fee|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]