专利摘要:
Die Erfindung betrifft eine Analyse eines regulatorischen genetischen Netzwerks einer Zelle. DOLLAR A Dabei wird ein kausales Netz verwendet, welches das regulatorische genetische Netzwerk der Zelle beschreibt, derart, dass Knoten des kausalen Netzes Gene des regulatorischen genetischen Netzwerks repräsentieren und Kanten des kausalen Netzes regulatorische Wechselwirkungen zwischen den Genen des regulatorischen genetischen Netzwerks repräsentieren. Dieses kausale Netz wird unter Verwendung eines Strukturlernverfahrens an das regulatorische genetische Netzwerk angepasst. Unter Verwendung eines Vorwissens über eine ausgewählte regulatorische Wechselwirkung zwischen zwei Genen wird eine a-priori-Information für die die ausgewählte regulatorische Wechselwirkung repräsentierende Kante ermittelt. Die a-priori-Information wird bei der Anpassung des kausalen Netzes an das regulatorische genetische Netzwerk unter Verwendung des Strukturlernverfahrens berücksichtigt.The invention relates to an analysis of a regulatory genetic network of a cell. A causal network is used that describes the regulatory genetic network of the cell, such that nodes of the causal network represent genes of the regulatory genetic network and edges of the causal network represent regulatory interactions between the genes of the regulatory genetic network. This causal network is adapted to the regulatory genetic network using a structure learning procedure. Using a prior knowledge of a selected regulatory interaction between two genes, a priori information is determined for the edge representing the selected regulatory interaction. The a-priori information is taken into account in the adaptation of the causal network to the regulatory genetic network using the pattern learning procedure.
公开号:DE102004030296A1
申请号:DE102004030296
申请日:2004-06-23
公开日:2006-01-12
发明作者:Mathäus Dejori;Martin Dr. Stetter
申请人:Siemens AG;
IPC主号:C12Q1-68
专利说明:
[0001] DieErfindung betrifft eine Analyse eines regulatorischen genetischenNetzwerks einer Zelle unter Verwendung eines statistischen Verfahrens.TheThe invention relates to an analysis of a regulatory geneticNetwork of a cell using a statistical method.
[0002] Aus[1] sind Grundlagen eines regulatorischen genetischen Netzwerkseiner Zelle bekannt. Unter einem solchen regulatorischen genetischenNetzwerk seien dabei im Folgenden insbesondere regulatorische Wechselwirkungenzwischen Genen einer Zelle verstanden.Out[1] are foundations of a regulatory genetic networka cell known. Under such a regulatory geneticIn the following, network are in particular regulatory interactionsunderstood between genes of a cell.
[0003] EinGenom, d.h. die menschliche Erbsubstanz, umfasst schätzungsweise20.000 bis 40.000 Gene, von denen jeweils eine biologisch bestimmteAnzahl – abhängig voneiner Spezialisierung einer Zelle – in Form einer DNA oder einesTeils einer DNA in einer Zelle vorhanden sind.OneGenome, i. the human genetic material, includes estimated20,000 to 40,000 genes, each of which is a biologically specificNumber - depending ona specialization of a cell - in the form of a DNA or aPart of a DNA are present in a cell.
[0004] Alsein Gen wird dabei ein nicht notwendigerweise zusammenhängenderAbschnitt dieser DNA bezeichnet, der einen genetischen Code für ein Proteinoder auch füreine Gruppe von Proteinen (Eiweißstoffe) bzw. für eine Erzeugungeines Proteins oder einer Proteingruppe enthält. Insgesamt beinhalten dieGene einen genetischen Code füretwa eine Million Proteine.Whena gene is not necessarily connectedSection of this DNA called a genetic code for a proteinor fora group of proteins (proteins) or for a productiona protein or a protein group. Overall, the includeGenes a genetic code forabout one million proteins.
[0005] EinWechselspiel bzw. die Wechselwirkungen der Gene untereinander sowiemit den Proteinen stellt den wichtigsten Teil einer Maschinerie(regulatorisches genetisches Netzwerk) dar, die einer Entwicklungeines menschlichen Körpersaus einer befruchteten Eizelle sowie allen Körperfunktionen zugrunde liegt.OneInterplay or the interactions of genes with each other andwith the proteins represents the most important part of a machinery(regulatory genetic network) that is a developmentof a human bodyfrom a fertilized egg and all body functions.
[0006] Auchaus [1] ist bekannt, dass sogenannte Gen-Expressionsraten, welcheein Gen-Expressionsmuster bilden, eine Beschreibung bzw. Repräsentationeines regulatorischen genetischen Netzwerks bzw. eines aktuellenZustands des regulatorischen genetischen Netzwerks liefern.Alsofrom [1] is known that so-called gene expression rates, whichform a gene expression pattern, a description or representationa regulatory genetic network or a current oneState of the regulatory genetic network.
[0007] Vereinfachtoder anschaulich ausgedrücktrepräsentiertsomit ein Gen-Expressionsmuster einer Zelle einen Zustand des regulatorischengenetischen Netzwerks dieser Zelle.simplifiedor clearly expressedrepresentsThus, a gene expression pattern of a cell is a regulatory stategenetic network of this cell.
[0008] Fernerist bekannt, dass unter Verwendung von Hochdurchsatz-Genexpressions-Messungen(Microarray-Daten) diese Gen-Expressionsraten messbar sind. DieMicroarray-Daten beschreiben wiederum Momentaufnahmen des Gen-Expressionsmusters.FurtherIt is known that using high-throughput gene expression measurements(Microarray data) these gene expression rates are measurable. TheMicroarray data in turn describe snapshots of the gene expression pattern.
[0009] Weiterist bekannt, dass sogenannte funktionale Pfade in einer bestimmtenZelle oder einem bestimmten Gewebe Prozesse eines Stoffwechsels,einer Genregulation, eines Transports und einer Signaltransduktionbeschreiben bzw. widerspiegeln.FurtherIt is known that so-called functional paths in a givenCell or a specific tissue processes of a metabolism,Gene regulation, transport and signal transductiondescribe or reflect.
[0010] Grundsätzlich können zelluläre, molekulareBeziehungen in direkte und indirekte Protein-Protein-Wechselwirkungenunterteilt werden.Basically, cellular, molecularRelationships in direct and indirect protein-protein interactionsbe divided.
[0011] DerStoffwechsel kann als Summe aller in einer Zelle vorkommenden enzymkatalysiertenReaktionen definiert werden.Of theMetabolism can be the sum of all enzyme-catalyzed processes occurring in a cellReactions are defined.
[0012] Dabeikann der Stoffwechsel in konzeptionelle Einheiten, so genannte Stoffwechselpfade,unterteilt werden, die durch gemeinsame Substrate in komplexen Netzwerkenmiteinander verflochten sind (vgl. 4).Here, the metabolism can be subdivided into conceptual units, so-called metabolic pathways, which are intertwined by common substrates in complex networks (cf. 4 ).
[0013] DerStoffwechsel hat zwei Hauptfunktionen: (1)Der Stoffwechsel liefert Energie, die zur Erhaltung einer internenZusammensetzung der Zelle und zur Unterstützung ihrer Funktionen erforderlichist. (2) Weiter liefert der Stoffwechsel Metaboliten, die die Zellebenötigt,um ihre Bestandteile und Produkte zu synthetisieren. The metabolism has two main functions: (1) The metabolism provides energy necessary to maintain an internal composition of the cell and to support its functions. (2) Metabolism also provides metabolites that the cell needs to synthesize its components and products.
[0014] DieMenge aller möglichenStoffwechselreaktionen kann als Graph (4) mit Kanten und Knoten dargestelltwerden. Der Stoffwechsel-Graph umfasst dabei zwei Arten von Knoten,nämlichMetaboliten und Enzyme. Die Kanten des Graphs stellen Substratreaktionenund Reaktion-Produkt-Beziehungen dar.The set of all possible metabolic reactions can be called graph ( 4 ) with edges and nodes. The metabolic graph includes two types of nodes, namely metabolites and Enzymes. The edges of the graph represent substrate reactions and reaction-product relationships.
[0015] 1 zeigt – graphisch verdeutlicht – eine indirekteProtein-Protein-Wechselwirkung, bei der ein Enzym e2 1000 durchein Enzym e1 1100 mithilfe eines Substrats s1 1200 reguliertwird, im Ausschnitt. 1 shows - graphically illustrated - an indirect protein-protein interaction in which an enzyme e2 1000 by an enzyme e1 1100 using a substrate s1 1200 is regulated, in clipping.
[0016] Sokatalysiert nach 1 dasEnzym e1 1100 das Substrat s1 1200, das vom Enzyme2 1000 benötigt 1102 wird.Damit interagiert 1101, 1102 e1 1100 mite2 1000 durch Substrat s1 1200. Da fast alle EnzymeProteine sind, kann dies als eine indirekte Protein-Protein-Wechselwirkungangesehen werden.So catalyzed after 1 the enzyme e1 1100 the substrate s1 1200 that of the enzyme e2 1000 needed 1102 becomes. Interact with it 1101 . 1102 e1 1100 with e2 1000 through substrate s1 1200 , Since almost all enzymes are proteins, this can be considered as an indirect protein-protein interaction.
[0017] Einedie Genexpression betreffende grundlegende Frage ist, durch welcheFaktoren diese gesteuert wird. Die Genexpression wird auf vielenmolekularen Ebenen reguliert, beginnend mit der DNA-Ebene durch DNA-Aufwindungsprozessebis zur mRNA-Ebenedurch Transkriptionsregulation.AThe fundamental question concerning gene expression is through whichFactors this is controlled. Gene expression is on manyregulates molecular levels, beginning with the DNA level through DNA winding processesto the mRNA levelby transcriptional regulation.
[0018] 2 zeigt – graphisch verdeutlicht -,wie die Regulation der Genexpression als eine indirekte Protein-Protein-Wechselwirkunginterpretiert werden kann. 2 shows - graphically illustrates - how the regulation of gene expression can be interpreted as an indirect protein-protein interaction.
[0019] Soreguliert 2101 nach 2 einProtein p1 2000 die Expression eines Gens 2200,das seinerseits für einProtein p2 2100 kodiert 2102. Graphisch verdeutlichterscheint es somit, dass p1 2000 indirekt mit p2 2100 interagiert210.So regulated 2101 to 2 a protein p1 2000 the expression of a gene 2200 , in turn, for a protein p2 2100 encoded 2102 , Graphically clarified it thus appears that p1 2000 indirectly with p2 2100 interacts 210.
[0020] VieleZellprozesse erfordern spezifische Wechselwirkungen zwischen verschiedenenProteinen.LotsCell processes require specific interactions between different onesProteins.
[0021] Einesogenannte posttranslationale Modifizierung dient als wichtigerMechanismus zur Modulation des Aufbaus, der Funktion, der Aktivität und Halbwertszeitvieler Proteine.Aso-called post-translational modification serves as more importantMechanism for modulation of structure, function, activity and half-lifemany proteins.
[0022] EinePhosphorylierung, d.h. die kovalente Bindung einer Phosphatgruppean entweder Serin, Threonin oder Tyrosin, ist die häufigsteModifizierung.APhosphorylation, i. the covalent bonding of a phosphate groupat either serine, threonine or tyrosine, is the most commonModification.
[0023] DiePhosphorylierung, darstellbar als Fall einer direkten Protein-Protein-Wechselwirkung,ist in 3 – graphischverdeutlicht – dargestellt.The phosphorylation, which can be represented as the case of a direct protein-protein interaction, is in 3 - illustrated graphically - shown.
[0024] Sowird nach 3 ein Proteinp2 3100 von einem Protein p1 3000 durch die Bindung 3101 einer Phosphatgruppep+ 3200 (Phosphorylierung) modifiziert 3101. DieseInteraktion kann als eine direkte Protein-Protein-Wechselwirkungangesehen werden.So is after 3 a protein p2 3100 from a protein p1 3000 through the bond 3101 a phosphate group p + 3200 (Phosphorylation) modified 3101 , This interaction can be considered as a direct protein-protein interaction.
[0025] Ausder Literatur sind Zusammenstellungen genetisch-biologischer Informationen,wie eine Datenbank TRANSFAC oder eine Datenbank Kyoto Encyclopediaof Genes and Genomes (KEGG), bekannt.Outthe literature are collections of genetic-biological information,like a database TRANSFAC or a database Kyoto Encyclopediaof Genes and Genomes (KEGG), known.
[0026] TRANSFACist eine Datenbank übereukaryotische, cis-aktive regulatorische DNA-Elemente und trans-aktiveFaktoren, die alles von der Hefe bis zum Menschen abdeckt.TRANSFACis a database abouteukaryotic, cis-active regulatory DNA elements and trans-activeFactors that cover everything from yeast to humans.
[0027] TRANSFACbietet Informationen überTranskriptionsfaktoren, ihre genomischen Bindungsstellen sowie ihreDNA-Bindungsprofile.TRANSFACprovides information aboutTranscription factors, their genomic binding sites and theirDNA-binding profiles.
[0028] Derzentrale Teil der Datenbank besteht in der Beschreibung spezifischerProtein-DNA-Wechselwirkungen, die für die Transkription von regulatorischerBedeutung sind.Of thecentral part of the database is the description of specificProtein-DNA interactions necessary for the transcription of regulatoryMeaning are.
[0029] DieDaten der TRANSFAC wurden im Allgemeinen der Originalliteratur entnommen,gelegentlich auch aus anderen Zusammenstellungen [15, 16], die geeigneteAngaben enthalten.TheData from TRANSFAC were generally taken from the original literature,occasionally also from other compilations [15, 16], the appropriate onesDetails included.
[0030] DieKyoto Encyclopedia of Genes and Genomes (KEGG) ist ein Versuch,das derzeitige Wissen der Molekular- und Zellbiologie in Bezug aufInformationspfade, die aus interagierenden Molekülen oder Genen bestehen, zucomputerisieren und Links aus den durch die Genom-Sequenzierungsprojekteerstellten Genkatalogen zur Verfügungzu stellen.TheKyoto Encyclopedia of Genes and Genomes (KEGG) is an attemptthe current knowledge of molecular and cell biology regardingInformation paths consisting of interacting molecules or genes tocomputerize and link from those through the genome sequencing projectsgene catalogs availableto deliver.
[0031] 4 zeigt – graphisch verdeutlicht – einenAusschnitt, d.h, einen Informationspfad, aus der KEGG, einen sogenanntenMethionin-Biosynthesepfad in S. cerevisiae 4000. 4 shows - graphically clarified - a section, ie, an information path, from the KEGG, a so-called methionine biosynthesis pathway in S. cerevisiae 4000 ,
[0032] 4 zeigt als Knoten symbolisierteMetaboliten 4100. Reaktionen, nach 4 durch Kanten 4200 dargestellt,sind mit der EC-Nummer 4300 des reaktionsspezifischen Enzymsgekennzeichnet. 4 shows symbolized metabolites as nodes 4100 , Reactions, after 4 through edges 4200 are shown with the EC number 4300 of the reaction-specific enzyme.
[0033] Diein S. cerevisiae nachgewiesenen Enzyme sind nach 4 schattiert 4400 dargestellt.The enzymes detected in S. cerevisiae are after 4 shaded 4400 shown.
[0034] VieleKrankheiten und Fehlfunktionen des Körpers gehen auf Störungen desregulatorischen genetischen Netzwerks zurück, welche sich in einem starkverändertenGen-Expressionsverhalten (Gen-Expressionsraten) bzw. einem verändertenGen-Expressmustereiner Zelle widerspiegeln.LotsDiseases and dysfunctions of the body are due to disorders of the bodyback to the regulatory genetic network, which is in a strongchangedGene expression behavior (gene expression rates) or an alteredGene Express patternreflect a cell.
[0035] Somitstellt ein Verständnisdes regulierenden genetischen Netzwerks einen wichtigen Schrittauf dem Weg zu einer Charakterisierung und einem Verstehen von genetischenMechanismen sowie in weiterer Folge zu einer Identifizierung vonsogenannten dominanten oder Funktionsstörungen auslösenden Genen dar, welche denKrankheiten oder Fehlfunktionen zugrunde liegen.Consequentlyrepresents an understandingthe regulatory genetic network is an important stepon the way to a characterization and an understanding of geneticMechanisms and subsequently to an identification ofso-called dominant or dysfunctional genes that theIllnesses or malfunctions underlie.
[0036] Beispielsweisekann in einer Krebsforschung, bei der die Identifizierung von Geschwülste undTumore unterdrückendenGenen eine Schlüsselrollespielt, die Kenntnis neuer potenzieller Onkogene und ihre Wechselwirkungmit anderen Genen ein Beitrag zu einer Aufdeckung von Grundprinzipien(von Krebserkrankungen) sein, welche eine Umwandlung normaler Zellenin bösartigeKrebszellen bestimmen.For examplecan in a cancer research, in the identification of tumors andTumors oppressiveGenes play a key roleplays, the knowledge of new potential oncogenes and their interactionwith other genes contributing to the detection of basic principles(of cancers), which is a transformation of normal cellsin maliciousDetermine cancer cells.
[0037] Weitergehendist füreine Entwicklung von verbesserten Medikamenten und Therapien zurBekämpfungvon genetischen Krankheiten daher ebenfalls ein quantitatives Verständnis desregulatorischen genetischen Netzwerks einer Zelle erforderlich.Proceedingis fora development of improved medicines and therapies forfightTherefore, also a quantitative understanding of genetic diseasesregulatory genetic network of a cell required.
[0038] Sowirken einige Medikamente als Agonisten bzw. Antagonisten spezifischerZielproteine, d. h. sie verstärkenoder schwächendie Funktion eines Proteins mit entsprechender Rückwirkung auf das regulatorische genetischeNetzwerk mit dem Ziel, dieses zurück in einen normalen Funktionsmoduszu bringen.SoSome drugs are more specific as agonists or antagonistsTarget proteins, d. H. reinforce themor weakenthe function of a protein with a corresponding retroactive effect on the regulatory geneticNetwork with the goal of bringing this back into a normal functional modebring to.
[0039] Aus[2] ist eine Beschreibung eines regulatorischen genetischen Netzwerkseiner Zelle unter Verwendung eines statistischen Verfahrens, eineskausalen Netzes, bekannt.Out[2] is a description of a regulatory genetic networka cell using a statistical method, acausal network, known.
[0040] Aus[3, 5] ist ein kausales Netz, ein Bayesianisches (Bayessches) Netzwerk,bekannt.Out[3, 5] is a causal network, a Bayesian (Bayesian) network,known.
[0041] EinBayes'sches NetzwerkB ist ein spezieller Typ der Darstellung einer gemeinsamen multivariaten Wahrscheinlichkeitsdichtefunktion(WDF) einer Menge von Variablen X durch ein graphisches Modell,welches aus zwei Teilen besteht.OneBayesian networkB is a special type of representation of a common multivariate probability density function(WDF) of a set of variables X by a graphical model,which consists of two parts.
[0042] Esist durch einen gerichteten azyklischen Graphen (directed acyclicgraph, DAG) G – dererste Bestandteil – definiert,in welchem jeder Knoten i = 1, ..., n einer Zufallsvariablen Xi entspricht.It is defined by a directed acyclic graph (DAG) G - the first constituent - in which each node i = 1, ..., n corresponds to a random variable X i .
[0043] DieKanten zwischen den Knoten repräsentierenstatistische Abhängigkeitenund könnenals Kausalzusammenhängezwischen ihnen interpretiert werden.TheRepresent edges between the nodesstatistical dependenciesand canas causal connectionsbe interpreted between them.
[0044] Derzweite Bestandteil des Bayes'schenNetzwerkes ist die Menge von bedingten WDFen P(Xi|Pai, θ, G),welche mittels eines Vektors θ parametriertsind.The second component of the Bayesian network is the set of conditional WDFs P (X i | Pa i , θ, G) which are parameterized by means of a vector θ.
[0045] Diesebedingten WDFen spezifizieren die Art der Abhängigkeiten der einzelnen Variableni von der Menge ihrer Elternknoten (Parents) Pai.Somit kann die gemeinsame WDF in die Produktform
[0046] DerDAG eines Bayes'schenNetzwerkes beschreibt auf eindeutige Weise die bedingten Abhängigkeits-und Unabhängigkeitsbe ziehungenzwischen einer Menge von Variablen, jedoch hat im Gegensatz dazu einegegebene statistische Struktur der WDF keinen eindeutigen DAG zurFolge.Of theDAG of a BayesianNetwork clearly describes the conditional dependencyand independence relationsbetween a set of variables, but in contrast has onegiven statistical structure of the WDF no clear DAGEpisode.
[0047] Vielmehrkann gezeigt werden, dass zwei DAG ein und dieselbe WDF beschreiben,dann und nur dann, wenn sie dieselbe Menge von Kanten und dieselbeMenge von "Colliders" aufweisen, wobeiein Collider eine Konstellation ist, in welcher wenigstens zweigerichtete Kanten zu demselben Knoten führen.Much morecan be shown that two DAG describe one and the same WDF,then and only if they have the same amount of edges and the sameHaving a set of "colliders", whereina collider is a constellation in which at least twodirected edges lead to the same node.
[0048] WeitereInformationen zur Verwendung statistischer Verfahren, insbesondereim Umfeld biologischer und genetischer Erkenntnisse, sind aus [11]bis [14] bekannt und stellen insbesondere hier mit einzubeziehendesFachwissen eines Fachmanns dar.FurtherInformation on the use of statistical methods, in particularin the environment of biological and genetic knowledge, are from [11]to [14] and in particular to be included hereExpertise of a specialist.
[0049] DerErfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, welcheseine Analyse eines regulatorischen genetischen Netzwerks einer Zelle,beispielsweise repräsentiertdurch mindestens ein Gen-Expressionsmuster der Zelle, ermöglicht.Of theInvention has for its object to provide a method whichan analysis of a regulatory genetic network of a cell,for exampleby at least one gene expression pattern of the cell.
[0050] Fernerliegt der Erfindung die Aufgabe zugrunde, ein Verfahren anzugeben,welches es ermöglicht bzw.welches ein Instrument schafft, mit welchem grundlegende Zusammenhänge genetischer,biologischer Vorgängein einer Zelle analysiert und veranschaulicht werden können.Furtherthe object of the invention is to specify a methodwhich makes it possible orwhich creates an instrument with which basic relationships of genetic,biological processescan be analyzed and illustrated in a cell.
[0051] Darüber hinaussoll die Erfindung es ermöglichen,ein bestimmtes Gen, wie ein defektes Gen, beispielsweise ein Onko- oder Tumor-Gen,in dem regulatorischen genetischen Netzwerk einer Zelle zu identifizieren.Furthermoreshould the invention make it possiblea particular gene, such as a defective gene, for example an oncogene or tumor gene,in the regulatory genetic network of a cell.
[0052] Weitersoll die Erfindung eine Simulation und/oder eine Analyse einer Wirkweiseeines Medikaments auf das regulatorische genetische Netzwerk einerZelle ermöglichen.Furtherthe invention is a simulation and / or analysis of a mode of actionof a drug on the regulatory genetic network of aEnable cell.
[0053] DieseAufgabe wird durch das Verfahren, durch das Computerprogramm mitProgrammcode-Mitteln und das Computerprogramm-Produkt zur Analyse eines regulatorischengenetischen Netzwerks einer Zelle mit den Merkmalen gemäß dem jeweiligenunabhängigenPatentanspruch gelöst.TheseTask is through the process, through the computer program withProgram code means and the computer program product for analyzing a regulatoryGenetic network of a cell with the characteristics according to the respectiveindependentClaim solved.
[0054] Beidem grundlegenden Verfahren zur Analyse eines regulatorischen genetischenNetzwerks einer Zelle wird ein kausales Netz verwendet, welchesdas regulatorische genetische Netzwerk der Zelle beschreibt derart,dass Knoten des kausalen Netzes Gene des regulatorischen genetischenNetzwerks repräsentieren undKanten des kausalen Netzes regulatorische Wechselwirkungen zwischenden Genen des regulatorischen genetischen Netzwerks repräsentieren.atthe basic procedure for the analysis of a regulatory geneticNetwork of a cell, a causal network is used, whichthe regulatory genetic network of the cell describes suchthat nodes of the causal network genes of the regulatory geneticRepresent network andEdges of the causal network regulatory interactions betweenrepresent the genes of the regulatory genetic network.
[0055] Dieseskausale Netz wird unter Verwendung eines Strukturlernverfahrensan das regulatorische genetische Netzwerk angepasst, wobei die Knotenund die Kanten des kausalen Netzes zumindest strukturell an dasregulatorische genetische Netzwerk der Zelle angepasst werden.Thiscausal network is using a structure learning processadapted to the regulatory genetic network, the nodesand the edges of the causal network at least structurally to theregulatory genetic network of the cell to be adapted.
[0056] Kennzeichnendwird hier unter Verwendung eines Vorwissens über eine ausgewählte regulatorische Wechselwirkungzwischen zwei Genen eine a-priori-Information für die die ausgewählte regulatorischeWechselwirkung repräsentierendeKante ermittelt.characteristicis here using an advance knowledge of a selected regulatory interactionbetween two genes a priori information for the selected regulatoryRepresenting interactionEdge determined.
[0057] Diese,d.h. die a-priori-Information fürdie die ausgewählteregulatorische Wechselwirkung repräsentierende Kante, wird nunbei der Anpassung des kausalen Netzes an das regulatorische genetischeNetzwerk unter Verwendung des Strukturlernverfahrens berücksichtigt.These,i.e. the a-priori information forwhich the selectedregulatory edge, now becomesin the adaptation of the causal network to the regulatory geneticNetwork using the pattern learning process.
[0058] DasComputerprogramm mit Programmcode-Mitteln ist eingerichtet, um alleSchritte gemäß dem erfindungsgemäßen Verfahrendurchzuführen,wenn das Programm auf einem Computer ausgeführt wird.TheComputer program with program code means is set up to allSteps according to the method of the inventionperform,if the program is running on a computer.
[0059] DasComputerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeichertenProgrammcode-Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Verfahrendurchzuführen,wenn das Programm auf einem Computer ausgeführt wird.TheComputer program product stored on a machine-readable mediumProgram code means is arranged to perform all steps according to the method of the inventionperform,if the program is running on a computer.
[0060] DasComputerprogramm mit Programmcode-Mitteln, eingerichtet um alleSchritte gemäß dem erfinderischenVerfahren durchzuführen,wenn das Programm auf einem Computer ausgeführt wird, sowie das Computerprogramm-Produktmit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln, eingerichtetum alle Schritte gemäß dem erfinderischenVerfahren durchzuführen,wenn das Programm auf einem Computer ausgeführt wird, sind insbesonderegeeignet zur Durchführungdes erfindungsgemäßen Verfahrensoder einer seiner nachfolgend erläuterten Weiterbildungen.TheComputer program with program code means, set up at allSteps according to the inventivePerform proceedings,when the program is run on a computer, as well as the computer program productwith program code means stored on a machine-readable carrieraround all steps according to the inventivePerform proceedings,in particular, if the program is run on a computersuitable for implementationthe method according to the inventionor one of its further developments explained below.
[0061] DerErfindung liegen grundlegende, nicht triviale Erkenntnisse, derenAnwendung und Umsetzung zugrunde.Of theInvention are basic, non-trivial findings whoseApplication and implementation underpinning.
[0062] Sowird erkannt, dass eine probabilistische Semantik eines kausalenNetzes, wie eines Bayes'schen Netzwerkes,zur Analyse von Gen-Expressionsraten, beispielsweise gegeben inForm von Microarray-Daten, sehr gut geeignet ist, da sie an diestochastische Natur sowohl von biologischen Prozessen als auch vonmit einem Rauschen behafteten Experimente angepasst ist.Sois recognized that a probabilistic semantics of a causalNetwork, like a Bayesian network,for analysis of gene expression rates given, for example, inForm of microarray data, very well suited, since they are attached to thestochastic nature of both biological processes as well as ofadapted to a noisy experiment.
[0063] Fernerwird, anschaulich gesehen, ein Effekt eines Expressionszustandesbestimmter Gene auf ein globales Gen-Expressionsmuster (inverseModellierung) geschätzt,indem ein resultierendes Gen-Expressionsmuster – erhältlich aus dem kausalen Netz – analysiertwird.Furtheris, intuitively, an effect of an expression stategenes to a global gene expression pattern (inverseModeling),by analyzing a resulting gene expression pattern - obtainable from the causal networkbecomes.
[0064] Weiterliegt dem Verfahren zur Analyse eines regulatorischen genetischenNetzwerks einer Zelle die nicht triviale und erfinderische Erkenntniszugrunde, dass durch Einführungeines Strukturpriors in einem Bayes'schen Schätzer Vorwissen über regulatorischeBeziehungen des regulatorischen genetischen Netzwerks berücksichtigtwerden bzw. miteinbezogen werden kann.Furtherlies the procedure for the analysis of a regulatory geneticNetwork of a cell's non-trivial and inventive knowledgeunderlying that by introductionof a structure prior in a Bayesian estimator prior knowledge of regulatoryRelationships of the regulatory genetic networkbe or can be involved.
[0065] Somitkann die Erfindung auch anschaulich in einer Schätzung regulatorischer Beziehungenzwischen den Genen eines Organismus aus statistischen Daten, wieden Genexpressionsdaten, unter Miteinbeziehung von unscharfem Vorwissen über regulatorischeBeziehungen gesehen werden.ConsequentlyThe invention can also be illustrated in an estimate of regulatory relationshipsbetween the genes of an organism from statistical data, such asGene expression data, including blurred prior knowledge of regulatoryRelationships are seen.
[0066] Durchdie nicht triviale Einführungeines Strukturpriors in einem Bayes'schen Schätzer wird ein datengetriebenesSchätzverfahrendurch Vorwissen geführt.Die Einführungdes Priors überdie regulatorischen Beziehungen zwischen Genen erlaubt einen Graddes Wissens überdas Vorhandensein und die Art der Beziehungen festzulegen.Bythe not trivial introductiona structure prior in a Bayesian estimator becomes a data driven oneestimation methodsguided by prior knowledge.The introductionof the Prior overthe regulatory relationships between genes allows a degreeof knowledge aboutdetermine the existence and type of relationships.
[0067] BevorzugteWeiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.preferredFurther developments of the invention will become apparent from the dependent claims.
[0068] Dieim weiteren beschriebenen Weiterbildungen beziehen sich sowohl aufdie Verfahren als auch auf die Anordnung.Thefurther developments described relate both tothe procedures as well as the arrangement.
[0069] DieErfindung und die im weiteren beschriebenen Weiterbildungen können sowohlin Software als auch in Hardware, beispielsweise unter Verwendungeiner speziellen elektrischen Schaltung, realisiert werden.TheInvention and the further developments described can bothin software as well as in hardware, for example usinga special electrical circuit can be realized.
[0070] Fernerist eine Realisierung der Erfindung oder einer im weiteren beschriebenenWeiterbildung möglichdurch ein computerlesbares Speichermedium, auf welchem das Computerprogrammmit Programmcode-Mitteln gespeichert ist, welches die Erfindungoder Weiterbildung ausführt.Furtheris an implementation of the invention or one described belowContinuing education possibleby a computer-readable storage medium on which the computer programis stored with program code means, which is the inventionor continuing education.
[0071] Auchkann die Erfindung oder jede im weiteren beschriebene Weiterbildungdurch ein Computerprogrammerzeugnis realisiert sein, welches einSpeichermedium aufweist, auf welchem das Computerprogramm mit Programmcode-Mittelngespeichert ist, welches die Erfindung oder Weiterbildung ausführt.Alsocan the invention or any further development describedbe realized by a computer program product, which is aStorage medium on which the computer program with program code meansis stored, which performs the invention or training.
[0072] Beieiner bevorzugten Weiterbildung ist das Vorwissen eine Information über einenfunktionellen Pfad, insbesondere einen Stoffwechselpfad, einer Zelle.Ein solcher funktioneller Pfad ist insbesondere geeignet zur Beschreibungvon Wechselwirkungen zwischen Stoffwechselprodukten.atIn a preferred embodiment, the prior knowledge is information about onefunctional path, in particular a metabolic path, a cell.Such a functional path is particularly suitable for descriptionof interactions between metabolites.
[0073] Auchkann der funktionelle Pfad eine Wechselwirkung zwischen einer Genregulation,einem Transport oder einer Signaltransduktion beschreiben.Alsothe functional pathway may be an interaction between a gene regulation,describe a transport or a signal transduction.
[0074] Bevorzugtist die a-priori-Information mindestens eine a-priori-Wahrscheinlichkeit für ein Vorliegen oderNichtvorliegen einer Markov-Beziehung zwischen Knoten des kausalenNetzes oder fürein Vorliegen oder Nichtvorliegen einer Markov-Beziehung einer Kante des kausalen Netzes.Prefersthe a-priori information is at least an a-priori probability of being orAbsence of a Markov relation between nodes of the causalNet or fora presence or absence of a Markov relation of an edge of the causal network.
[0075] Beider bevorzugten Weiterbildung werden mehrere a-priori-Informationen für mehreredie jeweiligen ausgewähltenregula torischen Wechselwirkungen repräsentierenden Kanten ermittelt.atIn the preferred embodiment, multiple a-priori information is provided for multiplethe selected onesregula toric interactions representing edges determined.
[0076] Auchkann bei der Ermittlung der a-priori-Information unter Verwendungdes Vorwissens die regulatorische Wechselwirkung zumindest als Teileines gerichteten Graphs interpretiert werden, wobei der Teil desgerichteten Graphs eine direkte oder indirekte, gerichtete Protein-Protein-Wechselwirkungsein kann.Alsomay be used in determining the a-priori informationof prior knowledge, the regulatory interaction at least in partof a directed graph, the part of thedirected graphs direct or indirect, directed protein-protein interactioncan be.
[0077] DasStrukturlernen kann unter Verwendung einer Bewertungsfunktion, beispielsweiseeines Bayes'schenScores, durchgeführtwerden, welche insbesondere gebildet wird aus einer marginalen Likelihood-Wahrscheinlichkeitund einer a-priori-Wahrscheinlichkeiteiner Struktur des kausalen Netzes.TheStructure learning can be done using a weighting function, for examplea BayesianScores, performedwhich in particular is formed from a marginal likelihood probabilityand an a priori probabilitya structure of the causal network.
[0078] Dabeikann eine Annahme zweckmäßig sein,nämlichdass die a-priori-Wahrscheinlichkeitder Struktur des kausalen Netzes zerlegbar ist.therean assumption may be appropriatenamelythat the a priori probabilitythe structure of the causal network can be dismantled.
[0079] Ineiner Weiterbildung wird als kausales Netz ein Bayesianisches bzw.Bayes'sches Netzverwendet, dessen Struktur insbesondere von einem Typ DAG (directedacylic graph) ist.Ina further education becomes as causal net a Bayesian resp.Bayesian networkused, whose structure in particular of a type DAG (directedacylic graph).
[0080] Auchkann vorgesehen werden, dass das kausale Netz unter Verwendung vonGen-Expressionsmustern trainiert wird, wobei die Knoten und dieKanten des kausalen Netzes angepasst werden.Alsocan be provided that the causal network usingGene expression patterns is trained, the nodes and theEdges of the causal network can be adjusted.
[0081] Fernerist es zweckmäßig, dassdie Gen-Expressionsmuster, bestimmt werden unter Verwendung einerDNA-Micro-Array-Technik.Furtherit is appropriate thatthe gene expression patterns can be determined using aDNA microarray technology.
[0082] Beieiner Ausgestaltung sind die Gen-Expressionsmuster für das TrainingGen-Expressionsmuster eines genetischen regulatorischen Netzwerkseiner kranken Zelle.atOne embodiment is the gene expression pattern for trainingGene expression pattern of a genetic regulatory networka sick cell.
[0083] Dabeikann beispielsweise die kranke Zelle eine Onko-Zelle sein, insbesondereeine Onko-Zelle mit ALL (Akute lymphoblastische Leukämie).thereFor example, the diseased cell may be an onco-cell, in particularan oncogene cell with ALL (acute lymphoblastic leukemia).
[0084] Fernerkann auch die kranke Zelle ein Onko-Gen, insbesondere ein ALL-Onko-Gen,aufweisen.Furtherthe diseased cell can also be an oncogene gene, in particular an ALL oncogene gene,exhibit.
[0085] Fernereignet sich die erfinderische Vorgehensweise oder Weiterbildungdavon insbesondere zur Identifizierung eines dominanten Gens und/odereines degenerierten/mutierten/kranken/onkogenen/Tumor-SuppressorGens.Furtheris the inventive approach or trainingin particular for identifying a dominant gene and / ora degenerate / mutated / diseased / oncogenic / tumor suppressorGene.
[0086] Aucheignet sie sich zur Identifizierung einer Tumorzelle, beispielsweiseim Zusammenhang mit einer Krebserkennung.Alsoit is suitable for identifying a tumor cell, for examplein the context of cancer detection.
[0087] Fernerist die erfinderische Vorgehensweise insbesondere geeignet zu einerUrsachenanalyse fürein abnormales Gen-Expressionsmuster/Gen-Expressrate.Furtherthe inventive approach is particularly suitable for aRoot cause analysis foran abnormal gene expression pattern / gene expression rate.
[0088] Auchkann sie eingesetzt werden zu einer Simulation und/oder Analyseeiner Wirkweise eines Medikaments.Alsoit can be used for a simulation and / or analysisa mode of action of a drug.
[0089] WeitereVorteile, Merkmale und Anwendungsmöglichkeiten der vorliegendenErfindung ergeben sich aus der nachfolgenden Beschreibung von Ausführungsbeispielenim Zusammenhang mit den Figuren.FurtherAdvantages, features and applications of the presentInvention will become apparent from the following description of exemplary embodimentsin connection with the figures.
[0090] EszeigenItdemonstrate
[0091] 1 eineSkizze, die eine indirekte Protein-Protein-Wechselwirkung zeigt, bei der ein Enzyme2 durch ein Enzym e1 mithilfe eines Substrats reguliert wird; 1 a sketch showing an indirect protein-protein interaction in which an enzyme e2 is regulated by an enzyme e1 using a substrate;
[0092] 2 eineSkizze, die eine indirekte Protein-Protein-Wechselwirkung zeigt, bei der ein Proteinp1 mit einem Protein p2 durch Regulation der Genexpression interagiert; 2 a sketch showing an indirect protein-protein interaction in which a protein p1 interacts with a protein p2 by regulating gene expression;
[0093] 3 eineSkizze, die eine direkte Protein-Protein-Wechselwirkung zeigt, bei der ein Proteinp1 mit einem Protein p2 durch Phosphorylierung interagiert; 3 a sketch showing a direct protein-protein interaction in which a protein p1 interacts with a protein p2 through phosphorylation;
[0094] 4 eineSkizze, die einen Ausschnitt, einen Informationspfad aus der KEGG,einen sogenannten Methionin-Biosynthesepfadin S. cerevisiae, zeigt; 4 a sketch showing a section, an information pathway from the KEGG, a so-called methionine biosynthesis pathway in S. cerevisiae;
[0095] 5 eineSkizze, die einen Stoffwechselpfad aus einem Schwefelmetabolismusvon S. cerevisiae zeigt. 5 a sketch showing a metabolic pathway from a sulfur metabolism of S. cerevisiae.
[0096] Zelluläre molekulareNetzwerksysteme entstehen durch komplexe Wechselwirkungen zwischenProteinen, DNA, RNA und anderen Molekülen.Cellular MolecularNetwork systems arise through complex interactions betweenProteins, DNA, RNA and other molecules.
[0097] Daskomplexe regulatorische Netzwerk zwischen Genen und Proteinen, dasgenetische Netzwerk, bildet einen zentralen Teil dieses zellulären Lebensmechanismus,wobei seine unterschiedlichen Betriebsarten die Vielzahl biochemischerVorgängein einer lebenden Zelle kontrollieren.Thecomplex regulatory network between genes and proteins, thegenetic network, forms a central part of this cellular life mechanism,its different modes of operation are the variety of biochemicaloperationsin a living cell.
[0098] EinHauptinteresse der postgenomischen Ära besteht daher darin, dieStruktur und Funktion genetischer Netzwerke im normalen Zellbetrieb,bei pathologischen Zuständennach Genschädigungund bei der Antwort auf Eingriffe von außen, wie z.B. Behandlung mitArzneistoffen oder extrazelluläreSignale, zu verstehen.OneThe main interest of the post-genomic era is, therefore, theStructure and function of genetic networks in normal cell operation,in pathological conditionsafter gene damageand in response to external intervention, such as Treatment withDrugs or extracellularSignals, to understand.
[0099] Beider ausführungsgemäßen Vorgehensweisewird eine Bayes'scheStatistik fürdie Analyse und Abbildung der Topologie genetischer regulatorischerNetzwerke angewandt.atthe execution procedurebecomes a BayesianStatistics forthe analysis and mapping of the topology of genetic regulatoryNetworks applied.
[0100] Durchdie Verwendung lernender Bayes'scherNetze [3, 6, 7, 9] wird die Struktur eines genetischen Netzwerksaus einem Satz von Genexpressions-Messungen [4] abgeschätzt, wobeidas Bayes'sche Netzdas genetische Netzwerk strukturell und/oder funktionell abbildet.Bythe use of learning BayesiansNetworks [3, 6, 7, 9] becomes the structure of a genetic networkestimated from a set of gene expression measurements [4], wherethe Bayesian networkstructurally and / or functionally maps the genetic network.
[0101] Weiterwird bei dem hier beschriebenen, ausführungsgemäßen Vorgehen die Netzwerktopologie,beispielsweise aus Mikroarray-Daten, mittels der Bayes'schen Statistik gelernt – und damitdas regulatorische genetische Netzwerk (funktionell) nachgebildetbzw. erzeugt -, wobei hier allerdings auf eine besondere Fähigkeit derBayes'schen Statistikzurückgegriffenund diese miteinbezogen wird.FurtherIn the embodiment described here, the network topology,for example, from microarray data, learned using Bayesian statistics - and thusthe regulatory genetic network (functional) modeledor generated, but here on a special ability ofBayesian statisticsresortedand this is involved.
[0102] DieBayes'sche Statistikermöglichteine Integration von Vorwissen bzw. a-priori-Wissen bei der Anpassungeines Bayesschen Netzes an die Topologie eines genetischen regulatorischenNetzwerkes, beispielsweise bekannte Wechselwirkungen zwischen bestimmtenGenen.TheBayesian statisticsallowsan integration of prior knowledge or a priori knowledge in the adaptationof a Bayesian network to the topology of a genetic regulatoryNetwork, for example, known interactions between certainGenes.
[0103] DieIntegration von a-priori-Wissen kann dann helfen, Strukturen zubestrafen, die keinen biologischen Sinn ergeben, und im Gegenzugbiologisch sinnvolle zu bevorzugen.TheIntegration of a priori knowledge can then help structurespunish those who do not make a biological sense, and in returnto favor biologically meaningful.
[0104] EineDichteabschätzungvon Genexpressionsdaten ist in [7, 8, 9] beschrieben und wird andieser Stelle nur kurz zusammengefasst.Adensity estimationof gene expression data is described in [7, 8, 9] and is publishedthis point only briefly summarized.
[0105] Beieinem Bayes'schenNetzwerk B handelt es sich um eine spezifische, zweiteilige Darstellungsform einergemeinsamen multivariaten Wahrscheinlichkeitsdichtefunktion (probabilitydensity function, pdf) P eines Satzes von Variablen X mittels einesgraphischen Modells.ata BayesianNetwork B is a specific, two-part representation of acommon multivariate probability density function (probabilitydensity function, pdf) P of a set of variables X by means of agraphical model.
[0106] Esist durch einen gerichteten azyklischen Graphen (directed acyclicgraph, DAG) G – einenersten Bestandteil – definiert,bei dem jeder Knoten i = 1, ..., n einer beliebigen Variablen Xi entspricht. Die Kanten zwischen den Knotenstellen statistische Abhängigkeitendar und lassen sich unter bestimmten Bedingungen [10] als Kausalbeziehungenzwischen ihnen interpretieren.It is defined by a directed acyclic graph (DAG) G - a first constituent - in which every node i = 1, ..., n corresponds to any variable X i . The edges between the nodes represent statistical dependencies and under certain conditions [10] can be interpreted as causal relations between them.
[0107] DerSatz von Eltern Pa(i) von i wird durch die Graphstruktur G als Knoten,die eine gerichtete Kante zu i aussenden, bestimmt.Of theSet of parents Pa (i) of i is represented by the graph structure G as a node,which send out a directed edge to i.
[0108] Derzweite Teil des Bayes'schenNetzes besteht aus dem Satz bedingter pdfs P(Xi|Pai,θ,G),die durch einen Vektor θ parametriertwerden. Die Verbindung zwischen G und Θ wird durch eine Markov-Unabhängigkeitdefiniert. Jede Variable Xi ist, bei gegebenenElternknoten Pai in G, von seinen Nicht-Nachkommen unabhängig.The second part of the Bayesian network consists of the set of conditional pdfs P (X i | Pa i , θ, G), which are parameterized by a vector θ. The connection between G and Θ is defined by a Markov independence. Each variable X i is, given given parent node Pa i in G, independent of its non-descendants pending.
[0109] Diesebedingten pdfs bestimmen die Art von Abhängigkeiten für jede Variablei von seinen Eltern Pai. So lässt sichdie gemeinsame pdf in die Produktform
[0110] Durchden DAG eines Bayes'schenNetzwerks werden die bedingten Abhängigkeits- und Unabhängigkeitsbeziehungenzwischen einem Satz von Variablen eindeutig beschrieben, doch kannim Gegensatz dazu durch eine gegebene statistische Struktur derpdf nicht auf einen eindeutigen DAG geschlossen werden.Bythe DAG of a BayesianNetworking becomes the conditional dependency and independence relationshipsbetween a set of variables clearly described, but canin contrast, by a given statistical structure ofpdf can not be concluded on a clear DAG.
[0111] Stattdessenlässt sichzeigen, dass zwei DAGs dieselbe pdf beschreiben, wenn, und zwarnur wenn sie denselben Kantensatz und denselben Collidersatz aufweisen,wobei es sich bei einem Collider um eine Konstellation handelt,bei der wenigstens zwei gerichtete Kanten im selben Knoten zusammenlaufen.Insteadlet yourselfshow that two DAGs describe the same PDF, if, and indeedonly if they have the same edge set and collider set,where a collider is a constellation,where at least two directed edges converge in the same node.
[0112] DAGsder selben Äquivalenzklasselassen sich mit einem einzigen partiellen gerichteten Graphen (partialdirected graph, PDAG) darstellen, wobei alle reversiblen Kantenin ungerichteter Form gezeichnet werden.DAGsthe same equivalence classcan be solved with a single partial directed graph (partialdirected graph, PDAG), all reversible edgesbe drawn in undirected form.
[0113] Beider Modellierung eines regulatorischen genetischen Netzwerks durchein Bayes'schesNetz sind die Gene bzw. ihre entsprechenden Proteine durch Knotensymbolisiert. Dabei wird angenommen, dass die regulatorischen Mechanismendurch Kanten zwischen zwei Knoten widergespiegelt werden.atthe modeling of a regulatory genetic networka BayesianNet are the genes or their corresponding proteins through nodessymbolizes. It is assumed that the regulatory mechanismsbe reflected by edges between two nodes.
[0114] Sinddie Kanten gerichtet, so wird dies als Richtung der Regulation interpretiert.Die Qualitätder Regulation (Erleichterung oder Unterdrückung) ist in der bedingtenWahrscheinlichkeitsverteilung des betroffenen Gens unter Vorgabeseiner Regulatoren codiert.arethe edges are directed, this is interpreted as the direction of regulation.The qualityThe regulation (relief or oppression) is in the conditionalProbability distribution of the affected gene under specificationcoded by its regulators.
[0115] DasErlernen Bayes'scherNetzwerke aus Daten ist zu einem zu nehmend aktiven Forschungsbereich gewordenund kann in zwei Problemstellungen unterteilt werden.TheLearn BayesianData networks have become an increasingly active area of researchand can be divided into two problems.
[0116] Imersten Fall ist die Netzwerkstruktur bereits bekannt und nur dieParameter müssenaus einer Datenmenge gelernt werden.in thefirst case, the network structure is already known and only theParameters mustbe learned from a dataset.
[0117] Diezweite Aufgabe, das strukturelle Lernen, ist schwieriger, da außer denParameterwerten auch die Netzwerkstruktur aus der Datenmenge gelerntwerden muss (strukturelles Lernen).Thesecond task, structural learning, is more difficult because except theParameter values also learned the network structure from the datasetmust be (structural learning).
[0118] DasVerfahren des strukturellen Lernens lässt sich wie folgt angeben:Es sei angenommen dass D = {d1, d2, ..., dN} ein Datensatzaus N unabhängigenBeobachtungen ist, wobei es sich bei jedem Datenpunkt um einen n-dimensionalenVektor mit den Komponenten dl = {d l / 1, ...,d l / n}, 1 = 1, ..., N handelt.The method of structural learning can be stated as follows: Let it be assumed that D = {d 1 , d 2 , ..., d N } is a set of N independent observations, where each data point is an n-dimensional Vector with the components d l = {dl / 1, ..., dl / n}, 1 = 1, ..., N acts.
[0119] Umdie Güteder Anpassung eines Netzwerks in Bezug auf die Datenmenge D zu bewerten,wird dem Graph G durch eine statistisch motivierte BewertungsfunktionS ein Wert S(G) (Bayesscher Score) zugeordnet.Aroundthe goodnessto evaluate the adaptation of a network with respect to the dataset D,becomes the graph G by a statistically motivated evaluation functionS is assigned a value S (G) (Bayesian score).
[0120] DieseBewertungsfunktion S ist aus den Methoden der Bayesschen Statistikhergeleitet. Sie ist proportional zur a-posteriori-Wahrscheinlichkeit einerNetzwerkstruktur bei gegebenen Daten:
[0121] P(D|G)ist die marginale Likelihood-Wahrscheinlichkeit, P(G) die a-priori-Wahrscheinlichkeitder Struktur und P(D) wird Evidence genannt.P (D | G)is the marginal likelihood probability, P (G) the a-priori probabilityof the structure and P (D) is called Evidence.
[0122] Dadie Evidence P(D) überdie verschiedenen Strukturen konstant ist, kann sie ignoriert werden.Therethe Evidence P (D) overthe different structures is constant, it can be ignored.
[0123] DesWeiteren kann die a-priori-Wahrscheinlichkeit der Struktur P(G)bei nicht vorhandenem a-priori-Wissen über die Strukturen durch einenicht-informative a-priori-Wahrscheinlichkeit ersetzt werden, also P(G)= const..OfFurthermore, the a-priori probability of the structure P (G)in the absence of a priori knowledge about the structures by anon-informative a-priori probability, ie P (G)= const ..
[0124] Wennbeide a-priori-Wahrscheinlichkeiten ignoriert werden, ist das Problemjetzt darauf reduziert, die Struktur mit der zu den entsprechendenDaten besten marginalen Likelihood-Wahrscheinlichkeit zu finden.IfBoth a-priori probabilities are ignored, the problem isnow reduced to the structure with the correspondingData to find best marginal likelihood probability.
[0125] Inanderen Worten: Wie wahrscheinlich ist es, dass die Daten aus derStruktur generiert worden sind. P(D|G) = ∫ P(D|Θ,G)P(Θ|G)dΘ (3) In other words, how likely is it that the data has been generated from the structure. P (D | G) = ∫ P (D | Θ, G) P (Θ | G) dΘ (3)
[0126] Beider gegebenen Gleichung 1 kann P(D|Θ, G) umgeschrieben werden:
[0127] Beieinem gegebenen Multinomial-Modell von n Variablen können, wieaus der Literatur bekannt ist, eine Reihe von Annahmen, und zwarvollständigeDaten, Parameterunabhängigkeitund Modularitätder Parameter, angenommen werden.ata given multinomial model of n variables can, likeFrom the literature is known a number of assumptions, namelyfullData, parameter independenceand modularitythe parameter to be accepted.
[0128] Damitund in Kombination mit a-priori-Dirichletverteilungen kann Gleichung4 umgeschrieben werden:
[0129]
[0130] Nijk bezeichnet die Anzahl der Fälle in derDatenmenge D, bei denen dl i,=k und Pai(dl) =j ist, und
[0131] EinVorteil der Bayes'schenStatistik liegt in der Fähigkeit,a-priori-Wissen mit den aus den Daten gewonnenen Informationen zukombinieren.OneAdvantage of BayesianStatistics lies in the abilitya priori knowledge with the information obtained from the datacombine.
[0132] Dahersollte in Bereichen, in denen a-priori-Wissen über die Struktur zur Verfügung steht,dieses a-priori-Wissen überdie a-priori-Wahrscheinlichkeit der Struktur P(G) in das Strukturlernengemäß der Bewertungsfunktionbeim Strukturlernen nach Gleichung 2 bzw. Gleichung 6 integriertwerden.Thereforeshould be used in areas where a priori knowledge of the structure is available,this a priori knowledge aboutthe a-priori probability of structure P (G) in structure learningaccording to the evaluation functionintegrated in structure learning according to equation 2 or equation 6become.
[0133] Insbesonderedann, wenn die Wahrscheinlichkeitsverteilung der Datenmenge sehrspärlichist, wie beispielsweise in Microarray-Versuchen, kann die Einbeziehungvon a-priori-Wissen in den Strukturlernalgorithmus dessen Leistungerheblich steigern.Especiallythen, if the probability distribution of the dataset is verysparsesuch as in microarray experiments, inclusion may beof a priori knowledge in the structural learning algorithm whose performanceincrease significantly.
[0134] Indiesem Falle zerlegt sich die Bewertungsfunktion S in zwei Teile: S(G|D) = P(D|G)P(G) (6),wobei P(D|G),wie oben beschrieben und nach Gleichung 5 berechenbar, die marginaleLikelihood-Wahrscheinlichkeit ist und P(G) die a-priori-Wahrscheinlichkeitder Struktur.In this case, the weighting function S is split into two parts: S (G | D) = P (D | G) P (G) (6) where P (D | G), as described above and computable according to Equation 5, is the marginal likelihood probability and P (G) is the a priori probability of the structure.
[0135] DerEinfachheit halber sei angenommen, dass die a-priori-Wahrscheinlichkeitder Struktur zerlegbar ist. Dann kann jede Kante von Knoten i zuKnoten j mit einer Wahrscheinlichkeit pji versehenwerden.For the sake of simplicity, assume that the a priori probability of the structure is decomposable. Then each edge from node i to node j can be given a probability p ji .
[0136] Diesist die gemeinsame Wahrscheinlichkeit p(i → j, → j → i), wobei p(i → j, j → i) = 0 – auf Grundder Bedingung der Azyklizitätdes Graphen.Thisis the common probability p (i → j, → j → i), where p (i → j, j → i) = 0 - based onthe condition of acyclicityof the graph.
[0137] Damitkann die a-priori-Wahrscheinlichkeit der Struktur zwischen Knoteni und Knoten j mit drei Ausdrückenbeschrieben werden: pji, pij und1 – (pji + pij), die a-priori-Wahrscheinlichkeitfür dasNicht-Vorliegen einer Markov-Beziehung zwischen Knoten i und Knotenj.Thus, the a-priori probability of the structure between node i and node j can be described with three expressions: p ji , p ij and 1 - (p ji + p ij ), the a-priori probability for the absence of one Markov relationship between node i and node j.
[0138] Wenna priori keine Informationen überdie Markov-Beziehung zwischen Knoten i und Knoten j vorliegen, habenalle drei oben beschriebenen Ausdrücke dieselbe Wahrscheinlichkeitvon 1/3.Ifa priori no information aboutthe Markov relationship between node i and node jall three expressions described above have the same probabilityfrom 1/3.
[0139] Fallsaus Vorwissen bekannt ist, dass es eine Kante zwischen i und j gebenmuss, jedoch keine Information zur Richtung der Kante verfügbar ist,haben pji und pij denselbenWert von 1/2.If it is known from previous knowledge that there must be an edge between i and j, but no information about the direction of the edge is available, then p ji and p ij have the same value of 1/2.
[0140] Andernfalls,d.h. bei Vorliegen der Richtungsinformation für die Kante i,j, hat das jeweiligepji bzw. pij denWert von 1.Otherwise, ie if the direction information for the edge i, j is present, the respective p ji or p ij has the value of 1.
[0141] DieMatrix P(G) stellt die a-priori-Informationen über die Struktur G eines Bayes'schen Netzwerks B dar,das aus 3 Variablen X1, X2 undX3 besteht.The matrix P (G) represents the a priori information about the structure G of a Bayesian network B consisting of 3 variables X 1 , X 2 and X 3 .
[0142] Für zwei Markov-Beziehungen,nämlichX2 – X3 und X1 – X3, liegen a-priori-Informationen vor.For two Markov relationships, X 2 - X 3 and X 1 - X 3 , a priori information is available.
[0143] Für X1 – X3 besagt die a-priori-Information, dass eineMarkov-Beziehung zwischen ihnen bestehen muss, und zwar von X2 nach X3, das gleichegilt fürX1 – X3, jedoch ohne Wissen über die Richtung.For X 1 - X 3 , the a-priori information states that there must be a Markov relation between them, from X 2 to X 3 , the same for X 1 - X 3 , but without knowledge of the direction.
[0144] Indiesem Falle erreichen von den 25 möglichen DAG 5 die maximalea-priori-Wahrscheinlichkeit von 1·1/3·1/2 = 0,16.InIn this case reach of the 25 possible DAG 5 the maximuma priori probability of 1 · 1/3 · 1/2 = 0.16.
[0145] DieseGraphen haben die folgenden Struktureigenschaften: X2 → X3, X1 → X3 oder X3 → X1 und eine beliebige Beziehung zwischen X1 und X2.These graphs have the following structural properties: X 2 → X 3 , X 1 → X 3 or X 3 → X 1 and any relationship between X 1 and X 2 .
[0146] Zusammennun mit der marginalen Likelihood-Wahrscheinlichkeit P(D|G), wieoben beschrieben und nach Gleichung 5 berechenbar, kann die BewertungsfunktionS für dasStrukturlernen gemäß Gleichung6 ermittelt werden, um – beimStrukturlernen – dieNetzwerkstruktur zu identifizieren, welche die Daten am besten nachbildet.Togethernow with the marginal likelihood probability P (D | G), likedescribed above and can be calculated according to equation 5, the evaluation functionS for thatStructure learning according to equation6 are determined to - atStructure learning - theIdentify the network structure that best replicates the data.
[0147] Imobigen wurden bereits Quellen bzw. Zusammenstellungen genetisch-biologischerInformationen, wie die Datenbank TRANFAC oder die Datenbank KyotoEncyclopedia of Genes and Genomes (KEGG), genannt, welche eine ungeheureMenge an biologischen Daten, die als strukturelles a-priori-Wissenverwendet werden können,zur Verfügungstellen.in theabove, sources or compilations have already been genetically-biologicalInformation such as the database TRANFAC or the database KyotoEncyclopedia of Genes and Genomes (KEGG), called a tremendousAmount of biological data as structural a-priori knowledgecan be usedto disposalput.
[0148] Nachfolgendwird gezeigt, wie Vorwissen bzw. a-priori-Wissen aus der Molekularbiologiein einen Strukturlernalgorithmus integriert werden kann.followingis shown as prior knowledge or a priori knowledge from molecular biologycan be integrated into a structural learning algorithm.
[0149] 5 zeigteinen Stoffwechselpfad 5000 aus dem Schwefelmetabolismusvon S. cerevisiae. 5 shows a metabolic pathway 5000 from the sulfur metabolism of S. cerevisiae.
[0150] DerPfad 5000 kann als eine Kette indirekter Protein-Protein-Wechselwirkungeninterpretiert werden, wobei jeder Metabolit 5100 das Produkteiner enzymatischen Reaktion 5200 sowie das Substrat für das folgendeEnzym 5300 ist.The path 5000 can be interpreted as a chain of indirect protein-protein interactions, with each metabolite 5100 the product of an enzymatic reaction 5200 and the substrate for the following enzyme 5300 is.
[0151] DaEnzyme eine Reaktion nur in einer Richtung katalysieren können, kannder Pfad 5000 als ein gerichteter Graph dargestellt werden,was als strukturelles a-priori-Wissen verwendet werden kann.Since enzymes can catalyze a reaction in one direction only, the pathway can 5000 are represented as a directed graph, which can be used as structural a-priori knowledge.
[0152] Derentsprechende Graph G besteht aus 3 Variablen X = {MET16, MET10,MET17}. Die a-priori-Wahrscheinlichkeit P(G) der Struktur kann unterBerücksichtigungdes Vorwissens aus den oben genannten Quellen umgeschrieben werden:
[0153] Gemäß den biologischenInformationen aus oben genannten Quellen kann hier pMET16MET10 und pMET10 MET17 mit 0,8 (gerundet),eine hohe a-priori-Wahrscheinlichkeit, angenommen werden.According to the biological information from the sources mentioned above, p MET16 MET10 and p MET10 MET17 can be assumed to be 0.8 (rounded), a high a priori probability.
[0154] Dieentsprechenden, umgekehrten Kanten haben eine geringe a-priori-Wahrscheinlichkeitvon 0,1 (gerundet), da, wie bereits oben erklärt, Enzyme nur in einer Richtungtätig sind.Thecorresponding inverse edges have a low a priori probabilityof 0.1 (rounded), since, as explained above, enzymes only in one directionare active.
[0155] Nurfür dieMarkov-Beziehung, zwischen MET16 und MET17, kann oben genanntenDatenquellen keine a-priori-Information entnommen werden, so dassdie Wahrscheinlichkeit füralle drei Wahrscheinlichkeiten (pji, pij, 1 – (pji + pij)) gerundet0, 3 beträgt.Only for the Markov relation, between MET16 and MET17, no a-priori information can be taken from the above-mentioned data sources, so that the probability for all three probabilities (p ji , p ij , 1 - (p ji + p ij )) rounded to 0, 3.
[0156] Weiternun kann gemäß Gleichung2 bzw. Gleichung 6 zusammen mit der marginale Likelihood-Wahrscheinlichkeitnach Gleichung 5 das Strukturlernen bewertet werden, um die Netzwerkstrukturzu identifizieren, welche die Daten am besten nach bildet.Furthernow according to equation2 or Equation 6 together with the marginal likelihood probabilityAccording to equation 5, the structure learning will be evaluated to the network structureidentify which data best matches the data.
[0157] Abschließend wirdgesondert ein besonderer Vorteil der Bayes'schen Statistik erwähnt: Die Bayes'sche Statistik ermöglicht,a-priori-Wissen mit den aus Daten gewonnenen Informationen zu kombinieren.Finally, it willmentioned separately a special advantage of Bayesian statistics: the Bayesian statistic allowsto combine a priori knowledge with information obtained from data.
[0158] Dahersollte in Bereichen, in denen a-priori-Wissen über die Struktur zur Verfügung steht,dieses a-priori-Wissen überdie a-priori-Wahrscheinlichkeit der Struktur P(G) in das Strukturlernengemäß der Bewertungsfunktionbeim Strukturlernen nach Gleichung 2 bzw. Gleichung 6 integriertwerden.Thereforeshould be used in areas where a priori knowledge of the structure is available,this a priori knowledge aboutthe a-priori probability of structure P (G) in structure learningaccording to the evaluation functionintegrated in structure learning according to equation 2 or equation 6become.
[0159] DieIntegration von a-priori-Wissen kann dann helfen, Strukturen zubestrafen, die keinen biologischen Sinn ergeben, z.B. wie hier gezeigtKante MET10 → MET16,und im Gegenzug biologisch sinnvolle zu bevorzugen, wie z.B. MET16 → MET10.TheIntegration of a priori knowledge can then help structurespenalize that do not give a biological sense, e.g. as shown hereEdge MET10 → MET16,and in turn to favor biologically useful ones, such as e.g. MET16 → MET10.
[0160] DieErforschung und das Verständnisvon Netzwerken molekularer Wechselwirkungen, ihrer Betriebsweisenunter unterschiedlichen Umständenund ihrer Antwort auf äußere Signaleist eine der Hauptherausforderungen der postgenomischen Ära.TheExploration and understandingnetworks of molecular interactions, their modes of operationunder different circumstancesand their response to external signalsis one of the main challenges of the post-genomic era.
[0161] DerDatenpool zur Rekonstruktion solcher Netzwerke wächst aufgrund von Technikenmit hohem Durchsatz schnell an. Die erhaltenen Netzwerke sind meistenssehr komplex, so dass die relevanten Informationen über daskartierte System und seine Komponenten nicht intuitiv sichtbar sindund eine zusätzlicheausführlichestatistische Analyse erforderlich machen.Of theData pool for reconstruction of such networks is growing due to techniquesfast with high throughput. The obtained networks are mostlyvery complex, so that the relevant information about themapped system and its components are not intuitively visibleand an additional onedetailedmake statistical analysis necessary.
[0162] Beidem beschriebenen ausführungsgemäßen Vorgehenwird eine Netzwerktopologie, beispielsweise aus Mikroarray-Daten,mittels Bayes'scherStatistik gelernt und damit das regulatorische genetische Netzwerk (funktionell)nachgebildet bzw. erzeugt. Dabei wird auf eine besondere Fähigkeitder Bayes'scherStatistik zurückgegriffenbzw. beim Strukturlernen ein Vorwissen bzw. a-priori-Wissen miteinbezogen.atthe described execution procedurebecomes a network topology, for example from microarray data,by means of BayesianLearned statistics and thus the regulatory genetic network (functional)reproduced or created. This is based on a special abilitythe BayesianStatistics usedor in structure learning a prior knowledge or a-priori knowledge involved.
[0163] DieIntegration von a-priori-Wissen kann dann helfen, Strukturen zubestrafen, die keinen biologischen Sinn ergeben und im Gegenzugbiologisch sinnvolle zu bevorzugen.The integration of a-priori knowledge can then help to punish structures that are not biological Make sense and in return to prefer biologically meaningful.
[0164] Indiesem Dokument sind folgende Schriften zitiert: [1]Stetter Martin et al., Large-Scale Computational Modeling of GeneticRegulatory Networks, Kluwer Academic Publisher, Niederlande, imDruck, 2004 [2] Offenlegungsnummer DE 10159262.0 [3] F. W. Jensen, F. V. (1996), An introduction to Bayesiannetworks, UCL Press, London; 178 pages [4] E.-J. Yeoh, M. E. Ross, S. A. Shurtleff, W. K. Williams,D. Petal et al. (2002), Classification, subtype discovery, and predictionof outcome in pediatric acute lymphoblastic leukemia by gene expressionprofiling. Cancer cell 1:133-143 [5] D. Heckerman, D. Geiger and D. Chickering (1995), LearningBayesian networks: The combination of knowledge and statisticaldata, Machine Learning 20:197-243 [6] Friedman, N., Goldszmidt, M. and Wyner, A. (1999). Dataanalysis with bayesian networks: a bootstrap approach, S. 196-205 [7] Friedman, N., Linial, M., Nachman, I. and Pe'er, D. (2000). UsingBayesian network analyze expression data., J. Comput. Biology 7:601-620 [8] Dejori, M. and Stetter, M. (2003). Bayesian inference ofgenetic networks from gene-expression data: convergence and reliability,Proceedings of the 2003 International Conference on Artificial Intelligence(IC-Al'03), S. 323-327 [9] Heckerman, D., Geiger, D. and Chickering, D. (1995). LearningBayesian networks: The combination of knowledge and statisticaldata, Machine Learning 20: 197-243 [10] Lauritzen, S.L. (1999). Causal interference from graphicalmodels, Technical report 5. R-99-2021 [11] Gavin, A.C., Bosche, M., Krause, R. and Grandi, P. (2002).Functional organization of the yeast proteome by systematic analysisof protein complexes, Nature 415: 378-381 [12] Baldi, P. and Hatfield, G.W. (2002). DNA microarrays andgene expression, Cambridge university press, Cambridge MA [13] Stetter, M., Deco, G. and Dejori, M. (2003). Large-scalecomputational modeling of genetic regulatory networks, AI Review,20: 75-93 [14] van Duk, M.A., Voorhoeve, P.M. and Murre, C. (1993). PBX1is converted into a transcriptional activator upon acquiring theN-terminal region of E2A in pre-b-cell acute lymphoblastic leukaemia,Proc. Natl. Acad. Sci. USA 90: 6061-6065 [15] Faisst and Meyer, Nucleic Acids Res. 20:3-26, 1992 [16] Dhawale and Lande, Nucleic Acids Res. 21:5537-5546, 1994), The following references are cited in this document: [1] Stetter Martin et al., Large-Scale Computational Modeling of Genetic Regulatory Networks, Kluwer Academic Publisher, Netherlands, in press, 2004 [2] Disclosure Number DE 10159262.0 [3] FW Jensen, FV (1996), An introduction to Bayesian networks, UCL Press, London; 178 pages [4] E.-J. Yeoh, ME Ross, SA Shurtleff, WK Williams, D. Petal et al. (2002), Classification, subtype discovery, and prediction of outcome in pediatric acute lymphoblastic leukemia by gene expression profiling. Cancer cell 1: 133-143 [5] D. Heckerman, D. Geiger and D. Chickering (1995), Learning Bayesian networks: The combination of knowledge and statistical data, Machine Learning 20: 197-243 [6] Friedman, N., Goldszmidt, M. and Wyner, A. (1999). Data analysis with bayesian networks: a bootstrap approach, pp. 196-205 [7] Friedman, N., Linial, M., Nachman, I. and Peer, D. (2000). Using Bayesian network analyze expression data., J. Comput. Biology 7: 601-620 [8] Dejori, M. and Stetter, M. (2003). Bayesian inference of genetic networks from gene-expression data: convergence and reliability, Proceedings of the 2003 International Conference on Artificial Intelligence (IC-Al'03), pp. 323-327 [9] Heckerman, D., Geiger, D. and Chickering, D. (1995). Learning Bayesian networks: The combination of knowledge and statistical data, Machine Learning 20: 197-243 [10] Lauritzen, SL (1999). Causal interference from graphical models, Technical report 5. R-99-2021 [11] Gavin, AC, Bosche, M., Krause, R. and Grandi, P. (2002). Functional organization of the yeast proteome by systematic analysis of protein complexes, Nature 415: 378-381 [12] Baldi, P. and Hatfield, GW (2002). DNA microarrays and gene expression, Cambridge University Press, Cambridge MA [13] Stetter, M., Deco, G. and Dejori, M. (2003). Large-scale computational modeling of genetic regulatory networks, AI Review, 20: 75-93 [14] van Duk, MA, Voorhoeve, PM and Murre, C. (1993). PBX1 is transformed into a transcriptional activator upon acquiring the N-terminal region of E2A in pre-b-cell acute lymphoblastic leukemia, Proc. Natl. Acad. Sci. USA 90: 6061-6065 [15] Faisst and Meyer, Nucleic Acids Res. 20: 3-26, 1992 [16] Dhawale and Land, Nucleic Acids Res. 21: 5537-5546, 1994),
权利要求:
Claims (22)
[1]
Verfahren zur Analyse eines regulatorischen genetischenNetzwerks einer Zelle unter Verwendung eines kausalen Netzes, – welcheskausale Netz das regulatorische genetische Netzwerk der Zelle beschreibtderart, dass Knoten des kausalen Netzes Gene des regulatorischengenetischen Netzwerks repräsentierenund Kanten des kausalen Netzes regulatorische Wechselwirkungen zwischenden Genen des regulatorischen genetischen Netzwerks repräsentieren,und – welcheskausale Netz unter Verwendung eines Strukturlernverfahrens an dasregulatorische genetische Netzwerk angepasst wird, wobei die Knotenund die Kanten des kausalen Netzes zumindest strukturell an das regulatorischegenetische Netzwerk der Zelle angepasst werden, dadurchgekennzeichnet, dass a) unter Verwendung eines Vorwissens über eineausgewählteregulatorische Wechselwirkung zwischen zwei Genen eine a-priori-Informationfür diedie ausgewählteregulatorische Wechselwirkung repräsentierende Kante ermitteltwird, b) bei der Anpassung des kausalen Netzes an das regulatorischegenetische Netzwerk unter Verwendung des Strukturlernverfahrensdie a-priori-Information berücksichtigtwird.Method for analyzing a regulatory genetic network of a cell using a causal network, - which causal network describes the regulatory genetic network of the cell such that nodes of the causal network represent genes of the regulatory genetic network and edges of the causal network regulatory interactions between the genes of the network represent a regulatory genetic network, and - which causal network is adapted to the regulatory genetic network using a structure learning procedure, wherein the nodes and the edges of the causal network are at least structurally adapted to the regulatory genetic network of the cell, characterized in that a) under Using a prior knowledge of a selected regulatory interaction between two genes, a priori information is determined for the edge representing the selected regulatory interaction, b) at An adaptation of the causal network to the regulatory genetic network using the structure learning process, the a-priori information is taken into account.
[2]
Verfahren nach Anspruch 1, – bei dem das Vorwissen eineInformation übereinen funktionellen Pfad, insbesondere einen Stoffwechselpfad, einerZelle ist.Method according to claim 1,- where the previous knowledge is oneinformation abouta functional path, in particular a metabolic path, aCell is.
[3]
Verfahren nach dem voranstehenden Anspruch, – bei demder funktionelle Pfad eine Wechselwirkung zwischen Stoffwechselprodukten,einer Genregulation, eines Transports oder einer Signaltransduktionbeschreibt.Method according to the preceding claim,- in whichthe functional pathway an interaction between metabolites,Gene regulation, transport or signal transductiondescribes.
[4]
Verfahren nach mindestens einem der voranstehendenAnsprüche, – bei demdie a-priori-Information mindestens eine a-priori-Wahrscheinlichkeitfür einVorliegen einer Markov-Beziehungzwischen Knoten des kausalen Netzes oder einer Kante des kausalenNetzes ist.Method according to at least one of the precedingClaims,- in whichthe a priori information is at least one a priori probabilityfor aExistence of a Markov relationshipbetween nodes of the causal network or an edge of the causalNet is.
[5]
Verfahren nach mindestens einem der voranstehendenAnsprüche, – bei demmehrere a-priori-Informationen fürmehrere die jeweiligen ausgewähltenregulatorischen Wechselwirkungen repräsentierenden Kanten ermitteltwerden.Method according to at least one of the precedingClaims,- in whichseveral a priori information forseveral of the selected onesascertaining the regulatory interactionsbecome.
[6]
Verfahren nach mindestens einem der voranstehendenAnsprüche, – bei dembei der Ermittlung der a-priori-Information unter Verwendung desVorwissens die regulatorische Wechselwirkung zumindest als Teileines gerichteten Graphs interpretiert wird.Method according to at least one of the precedingClaims,- in whichin the determination of the a-priori information using theForeword the regulatory interaction at least as a parta directed graph is interpreted.
[7]
Verfahren nach mindestens dem vorangehenden Anspruch, – bei demder Teil des gerichteten Graphs eine gerichtete Protein-Protein-Wechselwirkungist.Method according to at least the preceding claim,- in whichthe part of the directed graph is a directed protein-protein interactionis.
[8]
Verfahren nach einem der vorangehenden Ansprüche, – bei demals kausales Netz ein Bayes'schesNetz verwendet wird, dessen Struktur insbesondere von einem TypDAG (directed acylic graph) ist.Method according to one of the preceding claims,- in whichas a causal net a BayesianNetwork is used, whose structure in particular of a typeDAG (directed acylic graph) is.
[9]
Verfahren nach mindestens einem der voranstehendenAnsprüche, – bei demdas Strukturlernen unter Verwendung einer Bewertungsfunktion durchgeführt wird,welche insbesondere gebildet wird aus einer marginalen Likelihood-Wahrscheinlichkeitund einer a-priori-Wahrscheinlichkeit einer Struktur des kausalenNetzes.Method according to at least one of the precedingClaims,- in whichthe structure learning is performed using a weighting function,which in particular is formed from a marginal likelihood probabilityand an a priori probability of a structure of the causalNetwork.
[10]
Verfahren nach mindestens dem voranstehenden Anspruch, – bei demdie a-priori-Wahrscheinlichkeit der Struktur des kausalen Netzeszerlegbar ist.Method according to at least the preceding claim,- in whichthe a-priori probability of the structure of the causal networkis dismantled.
[11]
Verfahren nach mindestens einem der voranstehendenAnsprüche, – bei demdas kausale Netz unter Verwendung von Gen-Expressionsmustern trainiertwird, wobei die Knoten und die Kanten des kausalen Netzes angepasstwerden.Method according to at least one of the precedingClaims,- in whichtraining the causal network using gene expression patternsis adjusted, with the nodes and the edges of the causal networkbecome.
[12]
Verfahren nach einem der vorangehenden Ansprüche, – bei demdie Gen-Expressionsmuster bestimmt werden unter Verwendung einerDNA-Micro-Array-Technik.Method according to one of the preceding claims,- in whichthe gene expression patterns are determined using aDNA microarray technology.
[13]
Verfahren nach einem der vorangehenden Ansprüche, – bei demdie Gen-Expressionsmuster fürdas Training Gen-Expressionsmustereines genetischen regulatorischen Netzwerks einer kranken Zellesind.Method according to one of the preceding claims,- in whichthe gene expression pattern forthe training gene expression patterna genetic regulatory network of a diseased cellare.
[14]
Verfahren nach einem der vorangehenden Ansprüche, – bei demdie kranke Zelle eine Onko-Zelle, insbesondere eine Onko-Zelle mitALL (Akute lymphoblastische Leukämie)ist, welche insbesondere ein Onko-Gen, insbesondere ein ALL-Onko-Gen,aufweist.Method according to one of the preceding claims,- in whichthe sick cell has an onco-cell, especially an onco-cellALL (Acute lymphoblastic leukemia)which is in particular an oncogene gene, in particular an ALL oncogene gene,having.
[15]
Verfahren nach einem der vorangehenden Ansprüche, – eingesetztzur Identifizierung eines dominanten Gens.Method according to one of the preceding claims,- usedto identify a dominant gene.
[16]
Verfahren nach einem der vorangehenden Ansprüche, – eingesetztzur Identifizierung einer degenerierten/mutierten/kranken/onkogenen/Tumor-suppressorZelle und/oder Gens.Method according to one of the preceding claims,- usedto identify a degenerate / mutant / diseased / oncogenic / tumor suppressorCell and / or gene.
[17]
Verfahren nach einem der vorangehenden Ansprüche, – eingesetztzur Identifizierung einer Tumorzelle.Method according to one of the preceding claims,- usedto identify a tumor cell.
[18]
Verfahren nach einem der vorangehenden Ansprüche, – eingesetztzur Krebserkennung.Method according to one of the preceding claims,- usedfor cancer detection.
[19]
Verfahren nach einem der vorangehenden Ansprüche, – eingesetztzu einer Simulation und/oder Analyse einer Wirkweise eines Medikaments.Method according to one of the preceding claims,- usedto a simulation and / or analysis of a mode of action of a drug.
[20]
Computerprogramm mit Programmcode-Mitteln, um alleSchritte gemäß Anspruch1 durchzuführen, wenndas Programm auf einem Computer ausgeführt wird.Computer program with program code means to allSteps according to claim1 to perform, ifthe program is running on a computer.
[21]
Computerprogramm mit Programmcode-Mitteln gemäß dem vorangehendenAnspruch, welche Programmcode-Mitteln auf einem computerlesbarenDatenträgergespeichert sind.Computer program with program code means according to the precedingClaiming which program code means on a computer readablediskare stored.
[22]
Computerprogramm-Produkt mit auf einem maschinenlesbarenTrägergespeicherten Programmcode-Mitteln, um alle Schritte gemäß Anspruch1 durchzuführen,wenn das Programm auf einem Computer ausgeführt wird.Computer program product with on a machine-readablecarrierstored program code means to all steps according to claim1 to carry outif the program is running on a computer.
类似技术:
公开号 | 公开日 | 专利标题
Walsh et al.2018|Evolution and selection of quantitative traits
Zañudo et al.2017|Structure-based control of complex networks with nonlinear dynamics
Panzeri et al.2015|Neural population coding: combining insights from microscopic and mass signals
Bzdok et al.2017|Inference in the age of big data: Future perspectives on neuroscience
Bradford et al.2014|Discontinuity in the responses of ecosystem processes and multifunctionality to altered soil community composition
Schwalger et al.2017|Towards a theory of cortical columns: From spiking neurons to interacting neural populations of finite size
Romano et al.2015|Spontaneous neuronal network dynamics reveal circuit’s functional adaptations for behavior
Harris et al.2019|Hierarchical organization of cortical and thalamic connectivity
Voit2013|Biochemical systems theory: a review
Daunizeau et al.2014|VBA: a probabilistic treatment of nonlinear models for neurobiological and behavioural data
Laird et al.2009|ALE meta-analysis workflows via the brainmap database: progress towards a probabilistic functional brain atlas
Schneider et al.2005|Modeling task switching without switching tasks: a short-term priming account of explicitly cued performance.
Soranzo et al.2007|Comparing association network algorithms for reverse engineering of large-scale gene regulatory networks: synthetic versus real data
Grace et al.2012|Guidelines for a graph‐theoretic implementation of structural equation modeling
Stephan et al.2007|Dynamic causal models of neural system dynamics: current state and future extensions
Baldassi et al.2013|Shape similarity, better than semantic membership, accounts for the structure of visual object representations in a population of monkey inferotemporal neurons
Dey et al.2017|Visualizing the structure of RNA-seq expression data using grade of membership models
Mensi et al.2012|Parameter extraction and classification of three cortical neuron types reveals two distinct adaptation mechanisms
Kampichler et al.2010|Classification in conservation biology: a comparison of five machine-learning methods
Freyer et al.2011|Biophysical mechanisms of multistability in resting-state cortical rhythms
Cason et al.2015|Promoting cooperation in nonlinear social dilemmas through peer punishment
Oldham et al.2012|Network methods for describing sample relationships in genomic datasets: application to Huntington’s disease
Koulakov et al.2009|Correlated connectivity and the distribution of firing rates in the neocortex
US20140025358A1|2014-01-23|Systems and methods for modeling and analyzing networks
Panchanathan et al.2016|The evolution of sensitive periods in a model of incremental development
同族专利:
公开号 | 公开日
DE102004030296B4|2008-03-06|
US20060004529A1|2006-01-05|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2006-01-12| OP8| Request for examination as to paragraph 44 patent law|
2008-09-04| 8364| No opposition during term of opposition|
2009-04-23| 8339| Ceased/non-payment of the annual fee|
优先权:
申请号 | 申请日 | 专利标题
DE102004030296A|DE102004030296B4|2004-06-23|2004-06-23|Method for analyzing a regulatory genetic network of a cell|DE102004030296A| DE102004030296B4|2004-06-23|2004-06-23|Method for analyzing a regulatory genetic network of a cell|
US11/155,554| US20060004529A1|2004-06-23|2005-06-20|Method, computer program product with program code segments and computer program product for analysis of a regulatory genetic network of a cell|
[返回顶部]