专利摘要:
EineVorrichtung (100) zum Bestimmen eines Akkordtyps weist eine Einrichtung(102) zum Bereitstellen eines Referenzvektors für den Akkordtyp, eine Einrichtung(104) zum Bereitstellen eines Referenzvektors aus einem Testsignalund eine Einrichtung (106) zum Vergleichen des Referenzvektors mitdem Testsignalvektor (302) auf. Die Einrichtung (102) zum Bereitstelleneines Referenzvektors ist ausgebildet, um für den Akkordtyp einen Referenzvektoraus einer Mehrzahl von verschiedenen Referenzvektoren bereitzustellen.Weiterhin ist die Einrichtung (104) zum Bereitstellen eines Testsignalvektorsaus dem Testsignal ausgebildet, den Testsignalvektor mit einer Mehrzahlvon Testsignalvektorelementen bereitzustellen. Ferner ist die Einrichtung(106) zum Vergleichen des Referenzvektors mit dem Testsignalvektor ausgebildet,den Referenzvektor und den Testvektor oder um verschiedene Verschiebungswertezyklisch verschobene Versionen des Testsignalvektors miteinanderzu vergleichen, um verschiedene Vergleichsergebnisse zu erhalten, diedem Testsignalvektor oder Verschiebungswerten zugewiesen sind, umauf der Basis eines extremen Vergleichsergebnisses und des demselbenzugeordneten Verschiebungswertes den Akkordtyp zu bestimmen.
公开号:DE102004028693A1
申请号:DE102004028693
申请日:2004-06-14
公开日:2006-01-05
发明作者:Markus Cremer;Claas Derboven;Sebastian Streich
申请人:Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV;
IPC主号:G01H17-00
专利说明:
[0001] Dievorliegende Erfindung betrifft das technische Gebiet der musikalischenHarmonieerkennung und insbesondere betrifft die vorliegende Erfindung eineVorrichtung und ein Verfahren zum Bestimmen eines Akkordtyps unterVerwendung eines Referenzvektors für eine Tonart des Akkordtyps.
[0002] Indem letzten Jahrzehnt wuchs aufgrund der deutlich verbesserten Speicher-und Klang-Optimierung von aufgenommenen musikalischen Stücken dieBedeutung einer Klassifizierung dieser Musik-Stücke in eine Musikstilrichtung.Dabei war jedoch zu berücksichtigen,dass sich in den letzten Jahren eine Vielzahl von Unterarten einerMusikstilrichtung ausgebildet haben, wobei sich eine Klassifikationin beispielsweise die Musikstilrichtungen "Klassik", "Jazz", "Rock"... nicht mehr alsausreichend genug erwies. Hierbei war ferner zu beachten, dass durchdie erhebliche Zunahme von veröffentlichtenMusikstückenauch die Ausbildung von verschiedenen Musik-Geschmäckern verstärkt wurde. Durchdie Zunahme der unterschiedlichen Musikgeschmäcker und der deutlichen Zunahmeder veröffentlichtenMusikstückewurde dadurch auch eine Vorklassifizierung der Musikstücke notwendig,die dann meist als Meta-Daten (d.h. Daten über Daten) in elektronischerForm dem meist ebenfalls in elektronischer Form abgespeichertenMusikstückbeigefügt werden.Da die Klassifikation des Stücks,so wie sie den Meta-Daten entnommen werden kann, oftmals durch denWechsel des Musikgeschmacks überholt werden,war es notwendig, eine Möglichkeitzu schaffen, um Meta-Daten direkt aus den musikalischen Eigenschafteneines Musikstückeszeitnah vor einer Klassifikation zu generieren, wobei dann eineKlassifikation des Musikstücksnicht in den Meta-Daten abgelegt werden braucht, sondern lediglichdie musikalischen bzw. musiktheoretischen Eigen schaften des Musikstückes ausdiesem selbst erkannt werden und hieraus ein Rückschluss auf die Musikstilrichtung oderUnterklasse der Musikstilrichtung des Musikstückes gezogen werden kann.
[0003] Alsein deutliches Erkennungsmerkmal eines Musikstückes konnte in diesem Zusammenhangdie Klassifizierung von auftretenden Akkordtypen, wie beispielsweiseeinem D-Dur-Akkordoder einem G-Moll-Akkord in einem Musikstück als wichtiges Merkmal beieiner Klassifikation des Musikstückszu einer Musikstilrichtung oder Unterklasse einer Musikstilrichtungerkennen. In einem ersten Ansatz für eine Tonart-Erkennung einesMusikstückeswurde von David Temperley in dessen Schrift "The Recognition of Basic Musical Structures", The MIT Press,2001, Seiten 173 bis 187 vorgeschlagen, Tonartprofile durch eineempirische psycho-akustische Referenzmodellbildung erstellt werden.Diese Tonartprofile geben dann eine Häufigkeit an, wie oft ein bestimmter Tonbei einem beispielsweise C-Dur-Musikstück in diesem Musikstück im Verhältnis zuanderen Tönen auftritt.Solche Tonartprofile sind beispielsweise in 5A für die TonartC-Dur und in 5B fürdie Tonart D-Moll dargestellt. Soll nun ein zu untersuchendes Musikstück klassifiziertwerden, werden die in diesem Musikstück auftretenden zeitlichenDauern der einzelnen Halbtöne(beispielsweise C, Cis, D, ...) mit Hilfe eines Histogramms ausgewertetund mit den Tonartprofilen fürdie einzelnen Tonarten korreliert, wobei ein Korrelationskoeffizientermittelt wird. Im Anschluss hieran wird das zu untersuchende Musikstück in diejenigeTonart klassifiziert, die den höchstenKorrelationskoeffizienten des aus dem zu untersuchenden Musikstück resultierendenHistogramms und dem entsprechenden Tonartprofil ergibt.
[0004] Einderartiges Vorgehen weist jedoch den Nachteil auf, dass für die Erstellungeines aussagekräftigenHistogramms (als ein aussagekräftiger Testsignalvektor),ein zeitlich lang andauerndes Segment eines Musikstückes zuverwenden ist und sich innerhalb dieses Zeitsegmentes des zu untersuchendenMusikstückesdie Tonart des Musikstückes ändern kann.Dies führtdann zu einer ungenauen Klassifikation des Musikstückes. Fernerlässt sichdurch das vorstehend beschriebene Verfahren lediglich die Tonartdes Musikstückes(bzw. des untersuchten Zeitsegmentes des Musikstückes) erkennen, die Erkennungder Tonart eines einzelnen Akkordes ist somit nicht sichergestellt.Dies resultiert vor allem daraus, dass für kurze Zeitsegmente kein aussagekräftiges Histogrammauf grund der kurzen Zeitdauer des Segmentes erstellt werden kann.Das zeitliche Auflösungsverhaltendes vorstehend beschriebenen Verfahrens ist somit eingeschränkt.
[0005] Dervorliegenden Erfindung liegt daher die Aufgabe zugrunde, eine Möglichkeitzu schaffen, um einen einem Testsignal zugrunde liegenden Akkordtypzu bestimmen, wobei die Bestimmung des Akkordtyps, der dem Testsignalzugrunde liegt eine verbesserte zeitliche Auflösung ermöglichen soll, als dies im Standder Technik möglichist.
[0006] DieseAufgabe wird durch eine Vorrichtung zum Bestimmen eines Akkordtypsgemäß Anspruch 1und ein Verfahren zum Bestimmen eines Akkordtyps gemäß Anspruch16 gelöst.
[0007] Dievorliegende Erfindung schafft eine Vorrichtung zum Bestimmen einesAkkordtyps, der einem Testsignal zugrunde liegt, wobei der Akkordtyp durchein Auftreten von vorbestimmten Frequenzen in einem Frequenzbereichdes Testsignals definiert ist und die vordefinierten Frequenzenin dem Frequenzbereich des Testsignals Tönen in einer vorbestimmtenSpektralspanne entsprechen, wobei ein erster Akkordtyp wenigstenseinen ersten vordefinierten signifikanten Ton in der Spektralspannehat und wobei ein zweiter Akkordtyp einen zweiten vordefiniertensignifikanten Ton in der Spektralspanne hat, wobei sich der erstesignifikante Ton von dem zweiten signifikanten Ton unterscheidet,und wobei die Vorrichtung zum Bestimmen folgende Merkmale aufweist: eineEinrichtung zum Bereitstellen eines Referenzvektors für den Akkordtypaus einer Mehrzahl von verschiedenen Referenzvektoren, wobei derReferenzvektor eine Mehrzahl von Referenzvektorelementen aufweist,die je einem Ton in der Spektralspanne zugeordnet sind, und wobeiwenigstens ein Signifikanzreferenzvektorelement für jedenReferenzvektor füreinen signifikanten Ton eines zugeordneten Akkordtyps vorgesehenist; eine Einrichtung zum Bereitstellen eines Testsignalvektorsaus dem Testsignal, wobei der Testsignalvektor eine Mehrzahl vonTestsignalvektorelementen aufweist, die je einem Ton in der Spektralspannung zugeordnetsind, wobei ein Testsignalvektorelement davon abhängig ist,ob der Ton, der dem Testsignalvektorelement zugeordnet ist, in demTestsignal auftritt; und eine Einrichtung zum Vergleichen desReferenzvektors mit dem Testsignalvektor, wobei die Einrichtung zumVergleichen ausgebildet ist, den Referenzvektor mit dem Testsignalvektoroder um verschiedene Verschiebungswerte zyklisch verschobene Versionen desTestsignalvektors zu vergleichen, um verschiedene Vergleichsergebnissezu erhalten, die dem Testsignalvektor oder Verschiebungswerten zugewiesensind, um auf der Basis eines extremen Vergleichsergebnisses unddes demselben zugeordneten Verschiebungswertes den Akkordtyp zubestimmen.
[0008] Fernerschafft die vorliegende Erfindung ein Verfahren zum Bestimmen einesAkkordtyps, der einem Testsignal zugrunde liegt, wobei der Akkordtyp durchein Auftreten von vorbestimmten Frequenzen in einem Frequenzbereichdes Testsignals definiert ist und die vordefinierten Frequenzenin dem Frequenzbereich des Testsignals Tönen in einer vorbestimmtenSpektralspanne entsprechen, wobei ein erster Akkordtyp wenigstenseinen ersten vordefinierten signifikanten Ton in der Spektralspannehat und wobei ein zweiter Akkordtyp einen zweiten vordefiniertensignifikanten Ton in der Spektralspanne hat, wobei sich der erstesignifikante Ton von dem zweiten signifikanten Ton unterscheidet,und wobei das Verfahren zum Bestimmen folgende Schritte aufweist: Bereitstelleneines Referenzvektors fürden Akkordtyp aus einer Mehrzahl von verschiedenen Referenzvektoren,wobei der Referenzvektor eine Mehrzahl von Referenzvektorelementenaufweist, die je einem Ton in der Spektralspanne zugeordnet sind,und wobei wenigstens ein Signifikanzreferenzvektorelement für jedenReferenzvektor füreinen signifikanten Ton eines zugeordneten Akkordtyps vorgesehenist; Bereitstellen eines Testsignalvektors aus dem Testsignal,wobei der Testsignalvektor eine Mehrzahl von Testsignalvektorelementenaufweist, die je einem Ton in der Spektralspannung zugeordnet sind,wobei ein Testsignalvektorelement davon abhängig ist, ob der Ton, der demTestsignalvektorelement zugeordnet ist, in dem Testsignal auftrittund Vergleichen des Referenzvektors mit dem Testsignalvektor,wobei beim Vergleichen der Referenzvektor mit dem Testsignalvektoroder um verschiedene Verschiebungswerte zyklisch verschobene Versionen desTestsignalvektors verglichen wird, um verschiedene Vergleichsergebnissezu erhalten, die dem Testsignalvektor oder Verschiebungswerten zugewiesensind, um auf der Basis eines extremen Vergleichsergebnisses unddes demselben zugeordneten Verschiebungswertes den Akkordtyp zubestimmen.
[0009] Dervorliegenden Erfindung liegt die Erkenntnis zugrunde, dass durchdas Verwenden eines Referenzvektors und eines aus dem Testsignalermittelten Testsignalvektors ein Ver- Vergleichen des Referenzsignalvektorsmit dem Testsignalvektor erfolgen kann und der Akkordtyp direktaus dem Ergebnis des Vergleichens abgeleitet werden kann. Hierzuist gegenüberdem Stand der Technik nicht mehr das Bereitstellen von einer hohenAnzahl von Referenzvektoren notwendig. Vielmehr kann beispielsweisefür eineKlasse von Akkordtypen, wie die Dur-Akkorde, ein Referenzvektorbereitgestellt werden und aus der Kenntnis eines Abstandes zwischenzwei in einem Akkord auftretenden Tönen durch ein zyklisches Verschiebendes Testvektors und einem Vergleichen der verschobenen Version desTestvektors mit dem Referenzvektor ein Grundton des zu bestimmendenAkkordtyps ermittelt werden.
[0010] Dererfindungsgemäße Ansatzbietet den Vorteil, dass nicht mehr eine statistische Verteilung desAuftretens von Tönenbzw. Halbtönen(Histogramm) in dem Testsignal zur Bestimmung des Akkordtyps notwendigist. Vielmehr kann der Akkordtyp durch das Bereitstellen des Referenzvektorund dem aus dem Testsignal abgeleiteten Testsignalvektor mit eineranschließendeneinfachen zyklischen Verschiebung der Elemente des Testsignalvektorsauf einfache Art und Weise der Akkordtyp, der dem Testsignal zugrundeliegt, bestimmt werden. Herbei braucht dann nicht, wie im Standder Technik, auf eine hohe Anzahl von (psycho-akustisch ermittelten)Referenzvektoren zurückgegriffenwerden. Weiterhin ist auch, gegenüber dem Stand der Technik,das Vorliegen eines zeitlich lang andauernden Testsignals zur Akkordtypbestimmungnicht notwendig. Die bedeutet, dass das Testsignal, dem der Akkordtypzugrunde liegt, deutlich kürzersein kann als in herkömmlichen Ansätzen. Diesresultiert insbesondere daraus, dass im erfindungsgemäßen Ansatzlediglich das Auftreten eines Tons innerhalb des Testsignals ineinem Element des Testsignalvektors erfasst wird und somit beispielsweiseein gleichzeitiges Klingen von verschiedenen Tönen in einer zeitlich kurzenSpanne (beispielsweise einer Viertelnote) ausreicht, um über denspektralen Abstand der Töneden dem Testsignal zugrunde liegende Akkordtyp zu erkennen. Derer findungsgemäße Ansatzbietet somit gegenüberdem Stand der Technik den Vorteil, deutlich kleinere Zeitsegmenteauf Akkordtypen hin untersuchen zu können und somit eine deutlichhöhereGranularitätder Akkordtypbestimmung innerhalb eines Testsignals zu erreichen.
[0011] BevorzugteAusführungsbeispieleder vorliegenden Erfindung werden nachfolgend anhand der beiliegendenZeichnungen nähererläutert.Es zeigen:
[0012] 1 einBlockschaltbild eines Ausführungsbeispielsder erfindungsgemäßen Vorrichtung zumBestimmen eines Akkordtyps;
[0013] 2 eineTabelle übermusiktheoretisch bereitstellbare Referenzvektoren für verschiedene Klassenvon Akkordtypen;
[0014] 3A eine Darstellung eines Ausführungsbeispielsdes bis 3C erfindungsgemäßen Verfahren zumBestimmen eines Akkordtyps;
[0015] 4 einetabellarische Darstellung der Zuordnung eines Akkordtyps gemäß dem in 3 dargestelltenAusführungsbeispieldes erfindungsgemäßen Verfahrens;und
[0016] 5A eine Darstellung von Histogrammen, diein einer und 5B herkömmlichenTonartbestimmung als Referenzvektoren verwendet werden.
[0017] Inder nachfolgenden Beschreibung der bevorzugten Ausführungsbeispieleder vorliegenden Erfindung werden für die in den verschiedenenZeichnungen dargestellten und ähnlichwirkenden Elemente gleiche oder ähnlicheBezugszeichen verwendet, wobei auf eine wiederholte Beschreibungdieser Elemente verzichtet wird.
[0018] 1 zeigtein Blockschaltbild eines Ausführungsbeispielseiner erfindungsgemäßen Vorrichtung 100 zumBestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt.Hierbei umfasst die Vorrichtung 100 eine Einrichtung 102 zumBereitstellen eines Referenzvektors, eine Einrichtung 104 zumBereitstellen eines Testsignalvektors sowie eine Einrichtung 106 zumVergleichen des Referenzvektors mit dem Testsignalvektor. Die Einrichtung 102 zumBereitstellen eines Testvektors kann beispielsweise derart ausgebildetsein, um je einen Referenzvektor für Dur-Akkorde, Moll-Akkordeoder weitere Akkordklassen bereitzustellen, und diese über eineVerbindung 108 der Einrichtung 106 zum Vergleichendes Referenzvektors mit dem Testsignalvektor zuzuführen. Fernerkann die Einrichtung 104 zum Bereitstellen eines Testsignalvektorsausgebildet sein, um aus einem Testsignal 110 den Testsignalvektorzu ermitteln und diesen Testsignalvektor über die Verbindung 112 derEinrichtung 106 zum Vergleichen des Referenzvektors mitdem Testsignalvektor zuzuführen.Hierbei kann beispielsweise das Testsignal 110 in einerZeitbereichsdarstellung vorliegen, die einer analoge oder digitalenDarstellung des zu untersuchenden Musikstücks entspricht. Die Einrichtung 104 zumBereitstellen eines Testsignalvektors kann dann das Testsignal einerZeitbereichs-Frequenzbereichs-Transformation unterziehen, wodurchdie in dem Testsignal auftretenden Frequenzen ermittelt werden können undbeispielsweise eine Information übereine Amplitude in diesen, in dem Testsignal auftretenden Frequenzen,in einzelne Elemente des Testvektors geschrieben werden können. Üblicherweisewerden dann die in dem Testsignal auftretenden Frequenzen entsprechendenHalbtönenin einer Oktav zugeordnet. In der Einrichtung 106 zum Vergleichendes Referenzvektors mit dem Testsignalvektor wird durch eine nachfolgendnäher beschriebeneVorgehensweise ein Akkordtyp bestimmt und dieser über einen Ausgang 114 ausgegeben.
[0019] Dasin der Einrichtung 106 zum Vergleichen durchgeführte Verfahrender Akkordbestimmung basiert im Grunde auf einem Mustererkennungsverfahren.Tonale Ereignisse (d.h. das Auftreten von Tönen in dem Testsignal) werdenmit einem (oder mehreren) Referenzvektoren verglichen, die verschiedeneAkkordtypen bzw. Akkordtypklassen repräsentieren. Diese Referenzvektorenkönneneine Anzahl von beispielsweise 12 Referenzvektorelementen aufweisen, dieden 12 verschiedenen Halbtönenin einer Oktav der westlichen Notenskala entsprechen. Weiterhin können danndiejenigen Referenzvektorelemente auf den Wert 1 gesetzt werden,bei denen entsprechende Noten oder Töne in dem entsprechenden Akkordtypoder der Klasse von Akkordtypen auftreten, wobei dann die anderenReferenzvektorelemente auf den Wert 0 gesetzt werden können. Diein einem Akkord auftretenden Tönesind dabei fürden Akkordtyp signifikant und werden in der nachfolgenden Beschreibungals Signifikanz-Referenzvektorelemente bezeichnet. Beispielsweisekann der Referenzvektor für einenDur-Akkord den Wert 1 in dem ersten, fünften und achten (Signifikanz-)Referenzvektorelement enthalten oder der Referenzvektor für einenMoll-Akkord den Wert 1 in dem ersten, vierten und achten Referenzvektorelemententhalten, wogegen die anderen Referenzvektorelemente in den jeweiligenReferenzvektoren den Wert 0 haben.
[0020] Alternativzu Dur- oder Moll-Referenzvektoren können auch weitere Referenzvektorenverwendet werden, wie sie grob in der tabellarischen Darstellungin 2 wiedergegeben sind. Hierbei sind in den Zeilender in 2 dargestellten Tabelle verschiedene Klassen vonAkkorden, beispielsweise Dur- oder Moll-Akkorde sowie weitere Akkordklasse wiesus4, diminished (= vermindert), oder augmented (= übermäßig) aufgeführt, wobeiin den Spalten zunächstein Hauptackord HA fürdie jeweilige Akkordklasse angegeben wurde und nachfolgend weitere Nebenakkordewie einem Septakkord (durch die Spalten-Bezeichnung 7 gekennzeichnet),ein weiterer Septakkord (durch die Spalten-Bezeichnung m7 gekennzeichnet)und ein weiterer Akkord, der durch die Spaltenbezeichnung 9 gekennzeichnetist. Die entsprechenden Referenzvektoren können dabei die folgende Formannehmen: Dur: 100010010000 Moll: 100100010000 Vermindert: 100100100000 Übermäßig: 100010001000 Dur7: 100010010010 Moll7: 100100010010 Durm7: 100010010001 Mollm7: 100100010001 Dursus4: 100001010000 Dursus4 7: 100001010010 Dursus4m7: 100001010001 Dur9: 101010010000 Moll9: 101100010000
[0021] Weiterhinkann in der Einrichtung 104 zum Bereitstellen, wie siein 1 dargestellt ist, beispielsweise eine Matrixmit 12 Zeilen erstellt werden, wobei jede Zeile einen Halbton derwestlichen Notenskala repräsentiertund benachbarte Spalten dieser Matrix zeitlich aufeinanderfolgendenSegmenten des zu untersuchenden Musikstückes entsprechen. Im vorliegendenBeispiel kann dann das Testsignal als ein zeitliches Segment desMusikstücksbetrachtet werden, das in einer Spalte der Matrix aufgetragen ist.Die Elemente der Matrix werden vorzugsweise bei der Initialisierungder Matrix auf null gesetzt. Um die Halbtöne in der entsprechenden Matrixzu bestimmen, kann, wie oben näherdargestellt wurde, beispielsweise eine FFT (FFT = Fast Fourier Transformation= schnelle Fourier Transformation) als Zeit-Frequenzbereichstransformation verwendet werden.Hierdurch werden aus einem Zeitsegment des Musikstückes diein diesem Zeitsegment auftretende Frequenzen ermittelt und in derin 1 dargestellten Einrichtung 104 zum Bereitstelleneines Testsignalvektors in diejenigen Testsignalvektorelemente eineInformation überdas Auftreten einer Frequenz eingetragen, die den entsprechendenFrequenzen (Halbtönen)zugewiesen sind. Fürjedes Zeitsegment (d.h. fürjeden Zeit-Rahmen)könnensomit die Amplituden oder von Amplituden ab geleitete Werte in die Spaltender zuvor genannten Matrix eingetragen werden. Sollte ein Ton inmehr als einer Oktave innerhalb des Zeitsegmentes oder des Zeit-Rahmensauftreten, könnendie Amplituden oder von Amplituden abgeleitete Werte derjeningeTöne, dieden gleichen Grundton haben aber in mehreren Oktaven auftreten, zusammenaddiert und in die entsprechenden Zeile und Spalte eingetragen werden.Dies resultiert darin, dass dieser Ton ein höheres Gewicht für eine nachfolgendeVerarbeitung erhält.Jede Spalte dieser Matrix wird dann sukzessive mit allen Referenzvektoren verglichen,was beispielsweise durch die Berechnung eines Skalarproduktes ausdem Referenzvektor und dem aus einer Spalte der Matrix gebildetenTestsignalvektor durchgeführtwerden kann. Weiterhin werden die Referenzvektoren, die aus denSpalten der Matrix gebildet wurden, derart zyklisch verschoben,so dass alle Elemente, die nicht den Wert 0 haben, einmal an dervordersten Position des Referenzsignalvektors angeordnet sind undin einer derartigen Anordnung ein Vergleichsergebnis, beispielsweise durcheine Skalarproduktbildung ermittelt wird. Hierzu ist ferner anzumerken,dass zu einer Vereinfachung der Vergleichsergebnisbildung auch nichtdirekt die Amplituden der in den Zeitsegment auftretenden Frequenzenoder der entsprechenden Halbtöne verwendetwerden, sondern dass durch eine Schwellwertbildung festgestelltwerden kann, ob eine Frequenz in dem Testsignal (d.h. dem zu untersuchendenZeitsegment) in einer ausreichenden Stärke für die weitere Signalverarbeitungvorhanden ist. Diese ausreichende Stärke kann beispielsweise durch das Überschreitendes Amplitudenwertes überden Schwellwert gekennzeichnet sein, wobei dann bei dem Überschreitendes Amplitudenwertes das entsprechende Testsignalvektorelement denWert 1 erhältund fürden Fall, dass die Amplitude den Stellenwert des entsprechendenTones nicht überschreitet, dasTestsignalvektorelemente des entsprechenden Halbtons den Wert 0erhält.Durch eine derartige Zuordnung bzw. Schwellenwertbildung lassensich dann eindeutigere Ergebnisse ermitteln, wobei möglicherweisefehlerhafte Amplitudenwerte, die aus einer unpräzisen Zeit- Frequenzbereichstransformation resultieren,in ihrer Wirkung abgeschwächtwerden können.
[0022] Durchein solches zyklisches Verschieben der Elemente des Testsignalvektorslassen sich somit alle möglichenAkkordumkehrungen überprüfen. DieKlasse von Akkordtypen, die durch den Referenzvektor gekennzeichnetist, der bei dem Vergleichen beispielsweise durch die Skalarproduktbildung dashöchsteSkalarprodukt ergab, wird dann als Klasse des Akkordtyps ausgegeben.Weiterhin wird der entsprechende Grundton des erkannten Akkordtyps ausder Anzahl von erfolgten zyklischen Verschiebungen ermittelt, diezu dem höchstenSkalarprodukt führte.
[0023] Umzu verhindern, dass eine derartige Vorrichtung zum Bestimmen einesAkkordtyps unvollständigeAkkorde identifiziert, kann ein zusätzliches Kriterium angewandtwerden. Die Ergebnisse der Skalarproduktbildung für Referenzvektoren,die in einer Komponente des Referenzvektors den Wert 1 enthaltenund an der entsprechenden Stelle des Eingangsvektors (Testvektors)den Wert 0 aufweisen, werden bei der Bestimmung des Akkordtyps außer Achtgelassen. Fürden Fall, dass nur Referenzvektoren bereitstehen, die in Verbindungmit einem Eingangsvektor zu einem solchen außer Acht lassen der Ergebnissefür dieAkkorderkennung führt,kann der hierin vorgeschlagene Algorithmus derart ausgebildet sein,dass er die einzelnen Noten in dem entsprechenden Zeitrahmen oderZeitsegment ausgibt.
[0024] Für den Fall,dass der Eingangsvektor mehr Elemente als der Referenzvektor hat,wird die näheste Übereinstimmungzwischen Eingangsvektor und Referenzvektor gewählt. Dies kann beispielsweise dadurcherfolgen, dass im Eingangsvektor einzelne Elemente herausgenommenwerden, wodurch der Eingangsvektor in seiner Länge reduziert ist. Dieser reduzierteEingangsvektor kann dann mit dem oder den entsprechenden Referenzvektor(en)verglichen, bzw. das Skalarprodukt gebildet werden und das Ergebnis,das den besten Vergleichs wert oder das höchste Skalarprodukt liefert,als Endergebnis ausgegeben werden. In diesem Fall wird dann einvon der Amplitude der entsprechenden Noten abhängiger Wert besonders relevant,da laute Tönedann ein höheresGewicht bei der Berechnung des Skalarproduktes erhalten. Als letzterSchritt kann eine Erzeugung einer Textdatei erfolgen, die alle identifizierten Akkordebzw. Akkordtypen in chronologischer Reihenfolge enthält.
[0025] FernerkönnenHarmonien, deren zeitliche Dauer zu kurz für eine Berücksichtigung ist, von der Listeentfernt werden, da eine sichere Annahme darin gesehen werden kann,dass passende Akkorde nicht innerhalb von Millisekunden-Intervalle wechseln.
[0026] Esist somit ein großerVorteil des vorstehend vorgeschlagenen Algorithmus dass dieser eineAufwärtskompatibilität zur Bestimmungvon weiteren Akkordtypen aufweist, was einfach durch ein Hinzufügen vonneuen Referenzvektoren zu der Akkordmatrix möglich ist.
[0027] 3 zeigtdie Vorgehensweise bei der Ausführungdes erfindungsgemäßen Verfahrensin einem Ausführungsbeispiel.Hierzu wird wie beispielsweise die in der Beschreibung zu 1 genannte Matrixverwendet, die in den Zeilen die Töne bzw. Halbtöne einerOktav und in den Spalten die einzelnen Zeitsegmente oder Zeitrahmendes zu untersuchenden Musikstückeswiedergibt. In 3A ist eine Spalteeiner derartigen Matrix nunmehr als Eingangvektor 302 inZeilenform wiedergegeben, wobei jedes Element dieses Eingangsvektorseinen Halbton der westlichen Notenskala entspricht, deren Halbtöne bzw.Halbtonschritte in der Zeile 304 wiedergegeben sind. DerEinfachheit halber wird angenommen, dass die Amplituden der in demEingangsvektor vorkommenden Frequenzen oder Halbtönen (d.h.in dem dem Eingangsvektor entsprechenden Zeitsegment vorkommendenFrequenzen bzw. Halbtönen) nureine Amplitude von 1 oder 0 aufweisen. Analog kann auch eine Normierungauf den Wert 1 erfolgen, wenn die Amplitude des entsprechenden Tonseinen Schwellwert überschreitetoder eine Normierung auf den Wert 0 erfolgen, wenn die Amplitudezu dem entsprechenden Ton den Schwellwert unterschreitet. Zwischenwertewerden somit durch die vorstehend beschriebene Schwellwertentscheidungeliminiert. Eine solche Elimination ist jedoch nicht zwingend für die Funktionsfähigkeitdes beschriebenen Verfahrens notwendig.
[0028] ZurUntersuchung der in den einzelnen Zeitsegmenten des zu untersuchendenMusikstücksauftretenden Akkordtypen wird die vorstehend beschriebene Matrixspaltenweise durchlaufen und somit die jeweils aktuelle Spalte alsEingangsvektor 302 untersucht, wie in 3A dargestelltist. Die Akkorderkennung beruht dann darauf, diesen Vektor 302 inallen möglichenUmstellungen mit Referenzvektoren zu vergleichen, die die verschiedenenAkkordarten repräsentieren.Die bisher implementierten Referenzvektoren entsprechen dabei denunter Bezugnahme auf die 2 näher erläuterten Referenzvektoren. Beispielsweisewurde als Referenzvektor fürdie Moll-Akkorde die Folge von den Werten 100100010000 verwendet.
[0029] Zunächst wirddann im erfindungsgemäßen Vorgehender Eingangsvektor 302 wenn nötig so verschoben, dass daserste Element (d.h. dasjenige Element, das an der vordersten Positiondes Referenzvektors steht) nicht den Wert 0 hat. Da in 3A der Eingangsvektor die Werte 010001000010hat, kann durch ein zyklisches Verschieben des Eingangsvektors umein Element nach links ein verschobener Eingangsvektor erhaltenwerden, der an der im ersten Vektorelement (d.h. an der vorderstenPosition) den Wert 1 hat. Eine solche Verschiebung um ein Elementist in der Zeile 306 in 3A dargestellt.Für einesolche Umstellung, wie sie in der Zeile 306 durchgeführt wurde,kann dann ein Vergleichswert in Form eines Skalarproduktes berechnetwerden, wie er unter Verwendung des Referenzvektors für Moll-Akkordein einem Skalarproduktwert von 1 resultiert. Eine Aufstellung vonderartigen Skalarproduktwerten unter Verwendung des Re ferenzvektors für Moll-Akkordeund den entsprechenden Verschiebungswerten ist in 4 näher dargestellt.Der Verschiebungswert gibt hierbei die Anzahl von Verschiebungenan, um die ein verschobener Eingangsvektor in bezug auf den ursprünglichenEingangsvektor 302 zyklisch verschoben wurde.
[0030] Für die Bildungder ersten Umkehrung wird dann der in Zeile 306 verschobeneEingangsvekor um weitere 4 Elemente zyklisch nach links verschoben,so dass wiederum der Wert 1 an einer vordersten bzw. ersten Positiondes neuen verschobenen Eingangsvektors auftritt. Eine derartigeVerschiebung um 4 weitere Elemente ist in 3A inZeile 308 dargestellt. Eine Berechnung des Skalarproduktesfür diesenVerschiebungswert (d.h. den Verschiebungswert 5 = 1 + 4) lässt ergibtden Skalarproduktwert 1. Analog wird auch zur Bildung der zweitenUmkehrung wiederum eine zyklische Linksverschiebung durchgeführt, biswieder an der vordersten bzw. ersten Position des dritten verschobenenEingangsvektors wieder der Wert 1 steht. Ein solcher dritter verschobenerEingangsvektor mit dem Wert 1 an der vordersten bzw. ersten Positiondes dritten verschobenen Eingangsvektors kann durch eine weitereVerschiebung von 5 Elementen durchgeführt werden, so wie es der 3A in Zeile 310 erkennbar ist.Durch die Bildung des Skalarproduktes für den dritten verschobenenEingangsvektor unter Verwendung des Referenzvektors für Moll-Akkordekann somit ein Skalarproduktwert von 3 ermittelt werden wie es durchdie Skalarproduktbildung in 3B dargestellt ist.Bei dieser Skalarproduktbildung wird der Referenzvektor für Moll-Akkorde 312 mitdem dritten verschobenen Eingangsvektor wie er aus 3A Zeile 310 resultiertElementweise multipliziert und die Produkte nachfolgend Elementweiseaddiert, woraus sich der Skalarproduktewert von 3 ergibt. Wird demgegenüber einReferenzvektor fürDur-Akkorde 314 verwendet, wie er in 3C dargestelltist, und hieraus mit dem dritten verschobenen Eingangsvektor dasSkalarprodukt gebildet, resultiert ein Wert von zwei, der somitniedriger als das Ska larprodukt bei der Verwendung des Referenzvektorsfür Moll-Akkorde ist. Hierauskann geschlossen werden, dass für dieBedingung der Maximierung des Skalarproduktes (d.h. der Suche nachextremen Vergleichsergebnissen) der entsprechende Akkordtyp desursprünglichenEingangsvektors 302 ein Moll-Akkord sein muss, da das Skalarproduktfür denMoll-Referenzvektor 312 höher istals das Skalarprodukt des Dur-Referenzvektors 314 jeweilsbezogen auf den dritten verschobenen Eingangsvektor. In einer alternativenVorgehensweise kann auch je ein Skalarprodukt zwischen jeder einzelnenUmkehrung und jedem einzelnen Referenzvektor gebildet werden und letztendlichderjenige Referenzvektor bestimmt werden, unter dessen Verwendungdas höchsteSkalarprodukt erzeugt wurde.
[0031] DerGrundton des Akkordtyps kann dann durch eine Auswertung desjenigenVerschiebungswertes erfolgen, um den der Eingangsvektor 302 verschobenwurde um den verschobenen Eingangsvektor zu erhalten, unter dessenVerwendung mit dem Referenzvektor das maximale Skalarprodukt berechnetwurde. Fürdas in 3 gewählteAusführungsbeispieldes Eingangsvektors 302 kann somit bei einer zyklischenLinksverschiebung um 10 Elemente und unter Verwendung des Referenzvektorsfür Moll-Akkordedas maximale Skalarprodukt (mit dem Wert von 3) ermittelt werden,wobei der Verschiebungswert von 10 zu einem Grundton A# führt, worausder Akkordtyp A#-Moll resultiert. Eine derartige Zuordnung 400 vonVerschiebungswerten zu Akkordtypen ist in 4 näher dargestellt.Eine derartige Zuordnung 400 kann auch als Look-up-Tabelle beispielsweisein einem Speicher in der Einrichtung 106 zum Vergleichendes Referenzvektors mit dem Testsignalvektor implementiert sein,um eine deutliche Beschleunigung bei der Ermittlung des Akkordtyps beiKenntnis der Verschiebungswertanzahl zu erhalten.
[0032] Alternativzu der zuvor genannten Möglichkeitder Summation von Amplituden von in verschiedenen Oktaven auftretendenTönen kannauch eine Löschungvon Obertönenstattfinden.
[0033] JedeMusiknote – mitAusnahme von reinen synthetischen Sinussignalen – bestehen aus mehr als einerFrequenzkomponente. Diese zusätzlichen Komponentensind als Obertöneoder harmonische bekannt und erscheinen in der Spektraldarstellung beiVielfachen ihrer Grundfrequenz. Um eine verlässliche Harmonischen-Analyseaus einer Frequenzbereichsdarstellung eines Musiksignals zu erhalten,besteht die Schwierigkeit vor allem darin, diese Obertöne zu identifizierenund möglichstfür dieAkkordfindung nur den Grundton (in einer Oktav) zu verwenden. Hierbeiwurden fürdie weitere Akkorderkennung zwei Annahmen getroffen: 1. Ein Oberton kann lediglich während der Zeitdauer auftreten,währendder auch der Grundton präsentist. 2. Der Amplitudenpegel der Obertöne überschreitet nicht den Pegeldes Grundtons.
[0034] Insbesonderedie zweite Annahme erweist sich als problematisch, da es in polyphonerMusik durchaus häufigvorkommt, dass zwei Grundtöne zeitgleichauftreten, wobei der höhereGrundton einen niedrigeren Pegel hat, als der niedrigere Grundton,währendder höhereGrundton ein Oberton des niedrigeren Grundtons ist. Nach der obigenAnnahme müssteder höhereGrundton dann gelöschtwerden. Dies kann bei der Akkorderkennung dazu führen, dass bei der Bestimmungeines Akkordtyps diejenigen Töne,die außerhalbeiner betrachteten Oktav liegen nicht für die Bestimmung des Akkordtyps verwendetwerden.
[0035] Abhängig vonden Gegebenheiten kann das erfindungsgemäße Verfahren zum Bestimmeneines Akkordtyps, der einem Testsignal zugrunde liegt in Hardwareoder in Software implementiert werden. Die Implementierung kannauf einem digitalen Speichermedium, insbesondere einer Disketteoder CD mit elektronisch auslesbaren Steuersignalen erfolgen, dieso mit einem programmierbaren Computersystem zusammenwirken können, dassdas entsprechende Verfahren ausgeführt wird. Allgemein besteht dieErfindung somit auch in einem Compu terprogrammprodukt mit einemauf einem maschinenlesbaren Trägergespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens,wenn das Computerprogrammprodukt auf einem Rechner abläuft. Mitanderen Worten ausgedrückt,kann die Erfindung somit als ein Computerprogramm mit einem Programmcodezur Durchführungdes Verfahrens realisiert werden, wenn das Computerprogramm aufeinem Computer abläuft.
[0036] Zusammenfassendlässt sichsomit sagen, dass aus einem zu untersuchenden Musikstück eine Matrixgebildet werden kann, die in den Zeilen die Halbtöne einerOktave und in den Spalten die Zeitsegmente, d.h. die Zeitrahmendes zu untersuchenden Musikstücksenthältund in den jeweiligen Matrixelementen Werte eingetragen werden können, die vonAmplitudenwerten der zu den entsprechenden Zeitsegmenten und Halbtönen auftretendenAmplituden entsprechen. Um die Akkorderkennung durchzuführen, kannMatrix nun spaltenweise durchlaufen werden und die jeweils aktuelleSpalte als Vektor untersucht werden. Die Akkorderkennung beruhtdann darauf, diesen Vektor in allen möglichen Umstellungen mit Referenzvektorenzu vergleichen, die die verschiedenen Akkordarten repräsentieren.
[0037] Zunächst kannder Eingangsvektor, d.h. eine Spalte der Matrix wenn nötig so verschobenwerden, dass das erste Element keinen Wert von 0 hat. Dann werdendie Skalarprodukte mit allen Referenzvektoren gebildet. Anschließend wirddies auch füralle Umstellungen des Eingangsvektors berechnet. In einer besonderenForm braucht füralle Vergleiche, bei denen der Referenzvektor Einsen in Elementenbesitzt, in denen der Eingangsvektor Nullen hat, im folgenden nichtgewertet werden. Ist dies füralle Vergleiche 'derFall, werden vom hier vorgestellten Algorithmus beispielsweise dieEinzeltöneausgegeben. Ansonsten "gewinnt" der Referenzvektormit dem höchstenSkalarprodukt. Der Grundton ergibt sich aus der Anzahl der Elemente,um die der Eingangsvektor fürden Vergleich mit dem höchstenErgebnis verschoben wur de. In den 3 und 4 istder Moll-Referenzvektor derjenige mit dem höchsten Skalarprodukt, und zwarfür denVergleich mit der zweiten Umkehrung gegenüber beispielsweise den Dur-Referenzvektor.Daher wird ein Moll-Akkord angenommen. Der Grundton ergibt sichdaraus, dass der Vektor fürdas höchsteSkalarprodukt durch Verschiebung von insgesamt 10 Elementen zu Stande kommt.10 Halbtöne über demC liegt A#, d.h. wird ein Akkordtyp A#-Moll angenommen. Es werdenvorzugsweise nur Akkorde ausgegeben, die für eine Mindestdauer von beispielsweise10 Zeitrahmen behalten werden. Die gefundenen Akkorde können dannin chronologischer Reihenfolge mit ihren jeweiligen Dauern in eineTextdatei eingetragen und diese Textdatei ausgegeben werden.
权利要求:
Claims (17)
[1] Vorrichtung (100) zum Bestimmen einesAkkordtyps, der einem Testsignal (110) zugrunde liegt, wobeider Akkordtyp durch ein Auftreten von vorbestimmten Frequenzen ineinem Frequenzbereich des Testsignals (110) definiert istund die vordefinierten Frequenzen in dem Frequenzbereich des Testsignals (110)Tönen ineiner vorbestimmten Spektralspanne entsprechen, wobei ein ersterAkkordtyp wenigstens einen ersten vordefinierten signifikanten Tonin der Spektralspanne hat und wobei ein zweiter Akkordtyp einenzweiten vordefinierten signifikanten Ton in der Spektralspanne hat,wobei sich der erste signifikante Ton von dem zweiten signifikantenTon unterscheidet, und wobei die Vorrichtung (100) zumBestimmen folgende Merkmale aufweist: eine Einrichtung (102)zum Bereitstellen eines Referenzvektors (312, 314)für denAkkordtyp aus einer Mehrzahl von verschiedenen Referenzvektoren(312, 314), wobei der Referenzvektor (312, 314)eine Mehrzahl von Referenzvektorelementen aufweist, die je einemTon in der Spektralspanne zugeordnet sind, und wobei wenigstensein Signifikanzreferenzvektorelement für jeden Referenzvektor für einensignifikanten Ton eines zugeordneten Akkordtyps vorgesehen ist; eineEinrichtung (104) zum Bereitstellen eines Testsignalvektors(302) aus dem Testsignal (110), wobei der Testsignalvektor(302) eine Mehrzahl von Testsignalvektorelementen aufweist,die je einem Ton in der Spektralspannung zugeordnet sind, wobeiein Testsignalvektorelement davon abhängig ist, ob der Ton, der demTestsignalvektorelement zugeordnet ist, in dem Testsignal (110)auftritt; und eine Einrichtung (106) zum Vergleichendes Referenzvektors (312, 314) mit dem Testsignalvektor (302),wobei die Einrichtung (106) zum Vergleichen ausgebildetist, den Referenzvektor (312, 314) mit dem Testsignalvektor(302) oder um verschiedene Verschiebungswerte zyklischverschobene Versionen des Testsignalvektors (302) zu vergleichen,um verschiedene Vergleichsergebnisse zu erhalten, die dem Testsignalvektor(302) oder Verschiebungswerten zugewiesen sind, um aufder Basis eines extremen Vergleichsergebnisses und des demselbenzugeordneten Verschiebungswertes den Akkordtyp zu bestimmen.
[2] Vorrichtung (100) gemäß Anspruch 1, bei der die vorbestimmteSpektralspanne einer Oktav und die Töne in der vorbestimmten SpektralspanneHalbtönenin der Oktav entsprechen, wobei die Einrichtung (102) zumBereitstellen des Referenzvektors (312, 314) ausgebildetist, einen Referenzvektor (312, 314) mit zwölf Referenzvektorelementenbereitzustellen und wobei die Einrichtung (104) zum Bereitstellendes Testsignalvektors (302) ausgebildet ist, um einen Testsignalvektor(302) mit 12 Testsignalvektorelementen bereitzustellen.
[3] Vorrichtung (100) gemäß Anspruch 1 oder 2, bei derdie Einrichtung (104) zum Bereitstellen eines Testsignalvektors(302) ausgebildet ist, um ein in einer Zeitbereichsdarstellungvorliegendes Testsignal (110) in eine Frequenzbereichsdarstellungzu transformieren.
[4] Vorrichtung (100) gemäß einem der Ansprüche 1 bis3, bei der die Einrichtung (106) zum Vergleiche ausgebildetist, um eine Skalarproduktbildung zwischen dem Referenzvektor (312, 314)und dem Testsignalvektor (302) oder um verschiedene Verschiebungswertezyklisch verschobene Versionen des Testsignalvektors (302)durchzuführen,um das Vergleichsergebnis zu erhalten.
[5] Vorrichtung (100) gemäß einem der Ansprüche 1 bis4, bei der die Einrichtung (104) zum Bereitstellen desTestsignalvektors (302) ausgebildet ist, um einem Testsignalvektorelementeinen von einem Amplitudenwert des dem Testsignalvektorelement entsprechendenTones abhängigenWert zuzuweisen.
[6] Vorrichtung (100) gemäß Anspruch 5, bei dem die Einrichtung(104) zum Bereitstellen eines Testsignalvektors (302)ausgebildet ist, um einem Testsignalvektorelement einen Wert voneins zuzuweisen, wenn der dem Testsignalvektorelement entsprechendeTon einen Amplitudenwert aufweist, der einen vorbestimmten Schwellwert überschreitetund bei dem die Einrichtung (104) zum Bereitstellen einesTestsignalvektors (102) ausgebildet ist, dem Testsignalvektorelementeinen Wert von null zuzuweisen, wenn der dem Testsignalvektorelemententsprechende Ton einen Amplitudenwert aufweist, der den vorbestimmten Schwellwertunterschreitet.
[7] Vorrichtung (100) gemäß Anspruch 6, bei der die Einrichtung(106) zum Vergleichen ausgebildet ist, um die Testsignalvektorelementedes Testsignalvektors (302) um einen Verschiebungswertzyklisch derart zu verschieben, dass ein Testsignalvektorelementmit einem Wert von eins an einer vordersten Position in dem verschobenenTestsignalvektor (306, 308, 310) angeordnetist, wobei die Einrichtung zum Vergleichen (106) fernerausgebildet ist, um ein Vergleichsergebnis des Referenzvektors mitdem verschobenen Testsignalvektor (306, 308, 310)zu bestimmen.
[8] Vorrichtung (100) gemäß Anspruch 7, bei der die Einrichtung(106) zum Vergleichen ferner ausgebildet ist, um den verschobenenTestsignalvektor (306, 308, 310) um einenweiteren Verschiebungswert derart zyklisch zu verschieben, dasswieder ein Testsignalvektorelement mit einem Wert von eins an einervordersten Position in dem neuen verschobenen Testsignalvektor (308, 310)angeordnet ist, wobei die Einrichtung (106) zum Vergleichenferner ausgebildet ist, um ein Vergleichsergebnis des Referenzvektors(312, 314) mit dem neuen verschobenen Testsignalvektor(308, 310) zu bestimmen.
[9] Vorrichtung (100) gemäß einem der Ansprüche 6 bis8, bei der die Einrichtung (106) zum Vergleichen ausgebildetist, um kein Vergleichsergebnis zwischen dem Referenzvektor (312, 314)und dem Testsignalvektor (302) oder einer um einen Verschiebungswertzyklisch verschobenen Version des Testsignalvektors (302)zu bestimmen, wenn dasjenige Testsignalvektorelement den Wert nullaufweist, das an einer Position in dem Testsignalvektor (302)angeordnet ist, die einer Position eines Signifikanz-Referenzvektorelementsin dem Referenzvektor (312, 314) entspricht.
[10] Vorrichtung (100) gemäß einem der Ansprüche 1 bis9, bei der die Einrichtung (106) zum Vergleichen ausgebildetist, um kein Vergleichsergebnis zwischen dem Referenzvektor (312, 314)und dem Testsignalvektor (302) zu bestimmen, wenn einezeitliche Dauer der Tönein der vorbestimmten Spektralspanne einen vorbestimmten Mindestdauer-Schwellwertunterschreitet.
[11] Vorrichtung (100) gemäß einem der Ansprüche 1 bis9, bei dem die Einrichtung (102) zum Bereitstellen einesReferenzvektors (312, 314) ausgebildet ist, umeinen ersten Referenzvektor (312) für eine erste Klasse von Akkordtypenund einen zweiten Referenzvektor (314) für eine zweiteKlasse von Akkordtypen bereitzustellen.
[12] Vorrichtung (100) gemäß Anspruch 11, bei der dieAkkordtypen der ersten Klasse Dur-Akkorde und die Akkordtypen derzweiten Klasse Moll-Akkorde sind, wobei typen der zweiten KlasseMoll-Akkorde sind, wobei die Einrichtung (102) zum Bereitstelleneines Referenzvektors (312, 314) ausgebildet ist, umals ersten Referenzvektor (314) eine Folge von Werten derReferenzvektorelemente von 10001001000 und als zweiten Referenzvektor(312) eine Folge von Werten der Referenzvektorelemente von100100010000 bereitzustellen.
[13] Vorrichtung (100) gemäß einem der Ansprüche 1 bis12, bei dem die Einrichtung (104) zum Bereitstellen desTestsignalvektors (302) ausgebildet ist, um ein empfangenesSignal in ein erstes Testsignal und ein auf das erste Testsignalzeitlich nachfolgendes zweites Testsignal zu trennen, wobei dieEinrichtung (104) zum Bereitstellen eines Testsignalvektors(302) ferner ausgebildet ist, um einen ersten Testsignalvektorauf der Basis des ersten Testsignals und einen zweiten Testsignalvektorauf der Basis des zweiten Testsignals bereitzustellen, wobei fernerdie Einrichtung (106) zum Vergleichen ausgebildet ist, umeinen ersten Akkordtyp auf der Basis des ersten Testsignalvektorszu bestimmen und einen zweiten Akkordtyp auf der Basis des zweitenTestsignalvektors zu bestimmen.
[14] Vorrichtung (100) gemäß einem der Ansprüche 1 bis13, bei der das Testsignal (110) einen Signalanteil ineinem Frequenzsegment aufweist, der außerhalb der vorbestimmten Spektralspanneliegt, wobei die Einrichtung (106) zum Bereitstellen eines Testsignalvektors(302) ausgebildet ist, um ein Testsignalvektorelement inAbhängigkeitvon dem Signalanteil zu verändern.
[15] Vorrichtung (100) gemäß einem der Anspreche 1 bis 13,bei der die Einrichtung (106) zum Vergleichen einen Speicherumfasst, dem eine Zuordnung (400) von einem Referenzvektor(312) und einem Verschiebungswert zu einem Akkordtyp abspeicherbarist, wobei die Einrichtung (106) zum Vergleichen fernerausgebildet ist, um ein Vergleichsergebnis mit der Zuordnung (400)des Referenzvektors (312) und eines Verschiebungswerteszu dem Akkordtyp zu verknüpfen.
[16] Verfahren zum Bestimmen eines Akkordtyps, der einemTestsignal (110) zugrunde liegt, wobei der Akkordtyp durchein Auftreten von vorbestimmten Frequenzen in einem Frequenzbereichdes Testsignals (110) definiert ist und die vordefiniertenFrequenzen in dem Frequenzbereich des Testsignals (110) Tönen in einervorbestimmten Spektralspanne entsprechen, wobei ein erster Akkordtypwenigstens einen ersten vordefinierten signifikanten Ton in der Spektralspannehat und wobei ein zweiter Akkordtyp einen zweiten vordefiniertensignifikanten Ton in der Spektralspanne hat, wobei sich der erstesignifikante Ton von dem zweiten signifikanten Ton unterscheidet,und wobei das Verfahren zum Bestimmen folgende Schritte aufweist: Bereitstelleneines Referenzvektors (312, 314) für den Akkordtypaus einer Mehrzahl von verschiedenen Referenzvektoren (312, 314),wobei der Referenzvektor (312, 314) eine Mehrzahlvon Referenzvektorelementen aufweist, die je einem Ton in der Spektralspannezugeordnet sind, und wobei wenigstens ein Signifikanzreferenzvektorelementfür jeden Referenzvektorfür einensignifikanten Ton eines zugeordneten Akkordtyps vorgesehen ist; Bereitstelleneines Testsignalvektors (302) aus dem Testsignal (110),wobei der Testsignalvektor (302) eine Mehrzahl von Testsignalvektorelementenaufweist, die je einem Ton in der Spektralspannung zugeordnet sind,wobei ein Testsignalvektorelement davon abhängig ist, ob der Ton, der demTestsignalvektorelement zugeordnet ist, in dem Testsignal (110) auftritt;und Vergleichen des Referenzvektors (312, 314)mit dem Testsignalvektor (302), wobei beim Vergleichender Referenzvektor (312, 314) mit dem Testsignalvektor (302)oder um verschiedene Verschiebungswerte zyklisch verschobene Versionendes Testsignalvektors (302) verglichen wird, um verschiedeneVergleichsergebnisse zu erhalten, die dem Testsignalvektor (302) oderVerschiebungswerten zugewiesen sind, um auf der Basis eines extremenVergleichsergebnisses und des demselben zugeordneten Verschiebungswertes denAkkordtyp zu bestimmen.
[17] Computer-Programm mit Programmcode zur Durchführung desVerfahrens gemäß Anspruch16, wenn das Programm auf einem Computer abläuft.
类似技术:
公开号 | 公开日 | 专利标题
Korzeniowski et al.2016|Feature learning for chord recognition: The deep chroma extractor
Bittner et al.2017|Deep Salience Representations for F0 Estimation in Polyphonic Music.
US8497417B2|2013-07-30|Intervalgram representation of audio for melody recognition
US9203367B2|2015-12-01|Apparatus and method for modifying an audio signal using harmonic locking
Salamon et al.2013|Tonal representations for music retrieval: from version identification to query-by-humming
Marolt2004|A connectionist approach to automatic transcription of polyphonic piano music
Mauch2010|Automatic chord transcription from audio using computational models of musical context
Virtanen2007|Monaural sound source separation by nonnegative matrix factorization with temporal continuity and sparseness criteria
Plumbley et al.2002|Automatic music transcription and audio source separation
Klapuri2003|Multiple fundamental frequency estimation based on harmonicity and spectral smoothness
Papadopoulos et al.2010|Joint estimation of chords and downbeats from an audio signal
Mitrović et al.2010|Features for content-based audio retrieval
Goto2004|A real-time music-scene-description system: Predominant-F0 estimation for detecting melody and bass lines in real-world audio signals
US6930236B2|2005-08-16|Apparatus for analyzing music using sounds of instruments
DE69907498T2|2004-05-06|Verfahren zur schnellen erfassung der tonhöhe
US8442816B2|2013-05-14|Music-piece classification based on sustain regions
Mauch et al.2009|Simultaneous estimation of chords and musical context from audio
US6856923B2|2005-02-15|Method for analyzing music using sounds instruments
Zhu et al.2013|Multi-stage non-negative matrix factorization for monaural singing voice separation
JP4465626B2|2010-05-19|情報処理装置および方法、並びにプログラム
Engel et al.2017|Neural audio synthesis of musical notes with wavenet autoencoders
US7273978B2|2007-09-25|Device and method for characterizing a tone signal
US7035742B2|2006-04-25|Apparatus and method for characterizing an information signal
Virtanen2003|Sound source separation using sparse coding with temporal continuity objective
Duxbury et al.2001|Separation of transient information in musical audio using multiresolution analysis techniques
同族专利:
公开号 | 公开日
US7653534B2|2010-01-26|
DE102004028693B4|2009-12-31|
WO2005122136A1|2005-12-22|
JP2008502928A|2008-01-31|
US20070144335A1|2007-06-28|
JP4644250B2|2011-03-02|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2006-01-05| OP8| Request for examination as to paragraph 44 patent law|
2010-06-24| 8364| No opposition during term of opposition|
2020-01-01| R119| Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee|
优先权:
申请号 | 申请日 | 专利标题
DE102004028693A|DE102004028693B4|2004-06-14|2004-06-14|Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt|DE102004028693A| DE102004028693B4|2004-06-14|2004-06-14|Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt|
PCT/EP2005/004669| WO2005122136A1|2004-06-14|2005-04-29|Vorrichtung und verfahren zum bestimmen eines akkordtyps, der einem testsignal zugrunde liegt|
JP2007515799A| JP4644250B2|2004-06-14|2005-04-29|テスト信号に内在する和音の種類を決定するための装置および方法|
US11/607,659| US7653534B2|2004-06-14|2006-12-01|Apparatus and method for determining a type of chord underlying a test signal|
[返回顶部]