专利摘要:
Bei einem Ausführungsbeispiel weist ein Verfahren zum Erzeugen eines elektronisch veröffentlichbaren Dokuments ein Empfangen von Bilddaten, die einem physischen Dokument entsprechen, ein Segmentieren der Bilddaten, ein Erzeugen einer Markierungssprachendatei, die die segmentierten Bilddaten enthält, und ein Einbetten einer graphischen Benutzerschnittstelle in die Markierungssprachendatei auf, die eine Navigation zu segmentierten Bilddaten, wie dies durch den Benutzer ausgewählt wird, ermöglicht.
公开号:DE102004019623A1
申请号:DE102004019623
申请日:2004-04-22
公开日:2005-04-07
发明作者:Archie Fort Collins Carrington;Jeremy Fort Collins Cook;Wade D. Loveland Weitzel
申请人:Hewlett Packard Development Co LP;
IPC主号:G06F17-21
专利说明:
[0001] Gegenwärtig ermöglicht eseine Anzahl von Dokumentenformaten Benutzern, Inhalt zu codieren undzu verteilen. In dem vorliegenden Zusammenhang bezieht sich derAusdruck „Dokument" auf jede geeigneteDatenstruktur, die Text, Linienzeichnung, Bilder, Video, Audio und/oderdergleichen enthält,die geeignet zur elektronischen Verteilung oder Veröffentlichungist. Markierungssprachen, wie z. B. die Hypertext-Markierungssprache(HTML), die dynamische HTML und die erweiterbare Markierungssprache,werden häufigverwendet, um einen Dokumenteninhalt für Benutzer über das Internet zu erzeugen undbereitzustellen. Die Erzeugung eines Markierungssprachendokumentskann komplex sein. Obwohl eine Vielzahl von Markierungssprachendokumentbearbeitungsvorrichtungenund weiteren Markierungssprachenanwendungen existiert, erfordert esdie Erzeugung von Markierungssprachendokumenten üblicherweise, daß eine Anzahlvon Schritten manuell durchgeführtwird. Mit zunehmendem erwünschtenMaß anAusgereiftheit eines Markierungssprachendokuments wird üblicherweiseein entsprechendes höheresMaß anGeschicklichkeit von der Person, die für ein Erzeugen des Dokuments verantwortlichist, eingefordert.
[0002] Weiteregesetzlich geschützteFormate existieren, die es Personen mit einem relativ eingeschränkten technischenVerständnisermöglichen, ausgereifteDokumente zu erzeugen. Das PDF-Format von ADOBE® z.B. wird verwendet, um Dokumente zur Verteilung zu codieren. DasPDF-Format ist von Vorteil, da es ein Maß an Steuerung über die Darstellungeines Dokuments unabhängigvon dem System, das durch einen Empfänger des Dokuments verwendetwird, liefert. Zusätzlichliefert das PDF-Format eine Dokumentenstruktur. Ein „Tabulator"-Mechanismus kannz. B. verwendet werden, um Seiten, die dem Anfang eines Kapitelsoder eines bestimmten Themas zugeordnet sind, zu kennzeichnen. DasPDF-Format weist jedoch eine Anzahl von Einschränkungen auf. Insbesondere istdas PDF-Format gesetzlich geschützt.Folglich sind zur Erzeugung eines Dokuments gemäß dem PDF-Format eine spezialisierteSoftware und eine entsprechende Softwarelizenz nötig. Ferner müssen die Empfänger desDokuments eine Leseranwendung besitzen, die auf das PDF-Format angepaßt ist. Ebensoist die Verteilung von PDF-Dokumenten über das Internet dahingehendetwas problematisch, daß diePDF-Leseranwendung jedesmal innerhalb einer Browser-Anwendung gestartetwerden muß,wenn ein Benutzer überden Browser auf ein PDF-Dokument zugreift.
[0003] Weiteregesetzlich geschützteFormate sind verfügbar,wie z. B. die Formate WORD und POWERPOINT von MICROSOFT®. WORD-Dokumentenformatesind zur Dokumentenerzeugung höchst nützlich.Das WORD-Dokumentenformat kommt für eine elektronische Dokumentenveröffentlichungnicht oft zum Einsatz, da die hochentwickelten Merkmale des WORD-Formatsals mühseligund schwierig in der Verwendung angesehen werden. Das POWERPOINT-Formaterlaubt ein „Diashow"-Präsentationsformat,das im allgemeinen fürdie Veröffentlichung einesInhalts überdas Internet oder anderweitig wünschenswertist. Das POWERPOINT-Format ist jedoch gesetzlich geschützt underfordert es, daß die Empfänger vonPOWERPOINT-Dokumenten eine Leseranwendung zum Betrachten von POWERPOINT-Dokumentenbesitzen oder herunterladen müssen.Ferner sind die Navigationsfähigkeitenvon POWERPOINT-Dokumenten im allgemeinen auf die „Diashow"-Ordnung eines Inhaltsinnerhalb des Dokuments eingeschränkt.
[0004] Esist die Aufgabe der vorliegenden Erfindung, ein Verfahren, ein computerlesbaresMedium oder ein System zum Erzeugen eines elektronisch veröffentlichbarenDokuments mit verbesserten Charakteristika zu schaffen.
[0005] DieseAufgabe wird durch ein Verfahren gemäß Anspruch 1, ein computerlesbaresMedium gemäß Anspruch10 oder ein System gemäß Anspruch 18gelöst.
[0006] Beieinem Ausführungsbeispielweist ein Verfahren zum Erzeugen eines elektronisch veröffentlichbarenDokuments ein Empfangen von Bilddaten, die einem physischen Dokumententsprechen, ein Segmentieren der Bilddaten, ein Erzeugen einer Markierungssprachendatei,die die segmentierten Bilddaten enthält, und ein Einbetten einergraphischen Benutzerschnittstelle in die Markierungssprachendateiauf, die eine Navigation zu segmentierten Bilddaten, wie dies durchden Benutzer ausgewählt wird,ermöglicht.
[0007] Beieinem weiteren Ausführungsbeispiel weistein computerlesbares Medium, das ausführbare Instruktionen zum Erzeugeneines elektronisch veröffentlichbarenDokuments enthält,einen Code zum Segmentieren von Bilddaten eines physischen Dokuments,einen Code zum Erzeugen einer Markierungssprachendatei, einen Codezum Einkapseln der segmentierten Bilddaten in die Markierungssprachendateiund einen Code zum Einbetten einer graphischen Benutzerschnittstellein die Markierungssprachendatei auf, die eine Navigation zu densegmentierten Bilddaten ansprechend auf eine Benutzereingabe ermöglicht.
[0008] Beinoch einem weiteren Ausführungsbeispielweist ein System zum Erzeugen eines elektronisch veröffentlichbarenDokuments eine Einrichtung zum Bereitstellen von Bilddaten, eineEinrichtung zum Durchführeneiner Seitensegmentierung bezüglichder Bilddaten, eine Einrichtung zum Erzeugen einer Markierungssprachendatei,die segmentierte Daten enthält,die durch die Einrichtung zum Durchführen einer Seitensegmentierungerzeugt werden, und eine Einrichtung zum Einbetten einer graphischen Benutzerschnittstellein die Markierungssprachendatei auf, um eine Navigation gemäß einerBenutzereingabe zu den segmentierten Daten zu ermöglichen.
[0009] BevorzugteAusführungsbeispieleder vorliegenden Erfindung werden nachfolgend Bezug nehmend aufdie beiliegenden Zeichnungen nähererläutert.Es zeigen:
[0010] 1 ein System zum Erzeugenvon Dokumenten, die eine graphische Benutzerschnittstelle enthalten,gemäß repräsentativenAusführungsbeispielen;
[0011] 2 ein Flußdiagrammzum Segmentieren von Bilddaten;
[0012] 3 ein Flußdiagrammzum Erzeugen eines Dokuments, das eine graphische Benutzerschnittstelleenthält,aus segmentierten Daten gemäß repräsentativenAusführungsbeispielen;und
[0013] 4 eine Browseranzeige einesDokuments, das gemäß repräsentativenAusführungsbeispielenerzeugt wird.
[0014] RepräsentativeAusführungsbeispielesind auf Systeme und Verfahren zum Erzeugen eines Dokuments, daseine graphische Benutzerschnittstelle (GUI) enthält, gerichtet. RepräsentativeAusführungsbeispielekönnendurch ein Empfangen von Bilddaten von einem Scanner bzw. einer Abtastvorrichtungoder einer weiteren geeigneten Digitalbilderzeugungsvorrichtung(z. B. einer Digitalkamera) arbeiten. Die Bilddaten können mehrereSeiten eines abgebildeten Dokuments aufweisen. Die Bilddaten können verarbeitetwerden, um graphische Bilder, Linien, geometrische Bilder, Textund/oder dergleichen zu segmentieren. Eine Markierungssprachendatei oderein -dokument wird erzeugt und die geeigneten Markierungssprachenelemente(z. B. Kennungen bzw. Tags und geeignete Daten) werden in die Markierungssprachendateieingefügt,die den segmentierten Elementen aus den Bilddaten entspricht. Die ausden Bilddaten segmentierten Textdaten können einer optischen Zeichenerkennungsverarbeitungunterzogen werden. Aus dem umgewandelten Text können übliche Abschnittsidentifizierer(wie z. B. Kapitel, Abschnitt, Vorwärts, Glossar, Index und/oderdergleichen) in den Bilddaten angeordnet sein. Die Markierungssprachendateikann modifiziert sein, um Verbindungssteuerungen in z. B. einemInhaltsangabenabschnitt zu enthalten, was eine Benutzernavigationzu den relevanten Abschnitten ansprechend auf eine übliche Browsereingabeermöglicht.Ferner werden Dokumentenwechselsteuerungen zu der Markierungssprachendateihinzugefügt,um eine Benutzernavigation zu ermöglichen. Ferner ist eine Suchlogik inder Form einer geeigneten Schreibsprache in die Markierungssprachendateieingebettet, um eine Benutzernavigation ansprechend auf Benutzersuchanfragenzu ermöglichen.
[0015] 1 stellt ein System 100 dar,das ausführbareInstruktionen zur Erzeugung von Dokumenten, die eine graphischeBenutzerschnittstelle enthalten, verwendet. Die Dokumente sind unterVerwendung eines üblicherweiseverfügbarenarchitekturneutralen Formats codiert. Geeignete Formate umfassendie verschiedenen verfügbarenMarkierungssprachen, wie z. B. die Hypertext-Markierungssprache(HTML), die dynamische HTML (DHTML), die erweiterbare Markierungssprache(XML) und/oder dergleichen. Durch ein Verwenden eines üblicherweiseverfügbarenarchitekturneutralen Formats könnendie erzeugten Dokumente frei verteilbar sein. Dies bedeutet, daß die Empfänger dererzeugten Dokumente die Dokumente unter Verwendung üblicherweiseverfügbarerBrowseranwendungen empfangen und betrachten können, ohne daß der Erwerbvon Softwarelizenzen füreine gesetzlich geschützteAnwendung benötigtwird. Ferner ist der Mechanismus zum Veröffentlichen der erzeugten Dokumenterelativ einfach. Die erzeugten Dokumente können durch ein Senden der Dokumenteauf einem geeigneten Webserver veröffentlicht werden. Zusätzlich können die erzeugtenDokumente von Zeit zu Zeit aktualisiert werden, wie dies durch denVeröffentlichererwünscht wird.
[0016] RepräsentativeAusführungsbeispieleerzeugen Dokumente aus Bilddaten. In dem System 100 bildetein Scanner bzw. eine Abtastvorrichtung 101 oder jede weiteregeeignete Digitalbilderzeugungsvorrichtung physische Dokumente ab.Die Abtastvorrichtung 101 kann eine Dokumentenzuführungsvorrichtung(nicht gezeigt) aufweisen, um mehrere Seiten, die aufeinanderfolgendabgetastet werden sollen, aufzunehmen. Die Abtastvorrichtung 101 kann unterVerwendung einer Anzahl von Abtastvorrichtungen implementiert sein,die auf einer kommerziellen Basis breit verfügbar sind. Digitaldaten werden vonder Abtastvorrichtung 101 zur weiterer Verarbeitung anein Computersystem 102 kommuniziert.
[0017] DasComputersystem 102 kann unter Verwendung jeder geeignetenComputerplattform, wie z. B. eines Personalcomputers (PC), implementiert sein.Das Computersystem 102 weist einen Prozessor 103 auf,der unter der Steuerung ausführbarerInstruktionen arbeitet. Das Computersystem 102 weist fernereinen Direktzugriffsspeicher (RAM) 104 und einen Nur-Lese-Speicher(ROM) 105 auf, die Programmdaten und Benutzerdaten speichern.Das Computersystem 102 weist einen nichtflüchtigen Speicher 106,wie z. B. ein geeignetes Festplattenlaufwerk, auf. Die ausführbarenInstruktionen, die ein Markierungssprachenerzeugungs-Hilfsprogramm 107 definieren,könnenauf dem computerlesbaren Medium des nichtflüchtigen Speichers 106 gespeichertsein. Wenn das Markierungssprachenerzeugungs-Hilfsprogramm 107 durchden Benutzer betrieben wird, erzeugt dasselbe Dokumente 108,die jeweilige graphische Benutzerschnittstellen gemäß repräsentativenAusführungsbeispielenaufweisen. Die Dokumente 108 können auch in dem nichtflüchtigenSpeicher 106 gespeichert sein.
[0018] 2 stellt ein Flußdiagrammzur Verarbeitung von Bilddaten dar, die durch das Markierungssprachenerzeugungs-Hilfsprogramm 107 implementiertsein können.Bei Schritt 201 werden Bilddaten von einer Abtastvorrichtungoder einer weiteren geeigneten Bilderzeugungsvorrichtung empfangen.
[0019] BeiSchritt 202 werden graphische Bilder (wie z. B. Abbildungen,Photographien, Icons und/oder dergleichen) aus den Bilddaten identifiziert undsegmentiert. Bei Schritt 203 werden Linienzeichnung und/oderandere geometrische Elemente aus den Bilddaten identifiziert undsegmentiert. Bei Schritt 204 wird Text aus den Bilddatenidentifiziert und segmentiert. Die Identifizierung von Photographien,Linienzeichnung und/oder Text in Bilddaten wird als „Seitenzerlegung" bezeichnet. DieSeitenzerlegung kann gemäß einem „Unten-Nach-Oben"-Ansatz auftreten,bei dem lokale Informationen verwendet werden, um verbundene Komponentenzu identifizieren und verbundene Komponenten auf eine iterativeWeise zu gruppieren. Die Seitenzerlegung kann auch unter Verwendungeines „Oben-Nach-Unten"-Ansatzes auftreten,bei dem globale Informationen (z. B. schwarze und weiße Streifen)verwendet werden, um Segmente relevanter Daten zu identifizieren.Eine Erläuterungder Seitenzerlegung ist in Parameter-Free Geometric Document LayoutAnalysis (Parameterfreie geometrische Dokumententwurfsanalyse),IEEE Transactions on Pattern Analysis and Machine Intelligence,Bd. 23, Nr. 11, November 2001, von Seong-Whan Lee und Dae-Seok Ryugegeben, die hierin durch Bezugnahme aufgenommen ist. Ebenso offenbartdas U.S.-Patent Nr. 5,546,474, das hierin durch Bezugnahme aufgenommenist, einen Dokumentenanalysealgorithmus, der die Klassifizierungvon Bilddaten in Photoregionen und Nichtphotoregionen ermöglicht,um eine Seitenzerlegung zu erleichtern. Bei Schritt 205 werdendie segmentierten Textdaten einer bekannten Verarbeitung einer optischenZeichenerkennung (OCR) zur Erzeugung einer Textdatei unterzogen.
[0020] UnterVerwendung der segmentierten Daten und der Textdatei erzeugt dasMarkierungssprachenerzeugungs-Hilfsprogramm 107 ein Dokument,das eine graphische Benutzerschnittstelle enthält, um eine Benutzernavigationin dem Dokument zu ermöglichen.Das Markierungssprachenerzeugungs-Hilfsprogramm 107 kannden Prozeßfluß des Flußdiagrammsaus 3 implementieren.Bei Schritt 301 wird eine Markierungsspra chendatei erzeugt.Bei Schritt 302 werden separate Seiten innerhalb der Markierungssprachendateierzeugt. Die Seiten entsprechen der Anzahl physischer Seiten, die durchden Benutzer abgebildet werden. Die separaten Seiten in der Dateikönnenunter Verwendung geeigneter Seitenidentifizierer erzeugt werden.Bei Schritt 303 werden Markierungssprachenelemente (z.B. geeignete Kennungen und Daten) zu der Markierungssprachendateifür jedesder identifizierten und segmentierten Elemente aus den Bilddatenhinzugefügt.Die Markierungssprachenelemente werden innerhalb jeweiliger Abschnitteder Markierungssprachendatei auf eine Weise hinzugefügt, dieden ursprünglichenpaginierten Bilddaten entspricht. Bei Schritt 304 wirddie Textdatei, die aus der optischen Zeichenerkennungsverarbeitungerzeugt wurde, nach dem Auftreten von Abschnittsidentifizierern oderSchlüsselwörtern (wiez. B. Kapitel, Index, Glossar und/oder dergleichen) durchsucht.Bei Schritt 305 kann eine Benutzereingabe empfangen werden,um zusätzlicheAbschnittsidentifizierer zu erzeugen oder autonom erzeugte Abschnittsidentifiziererzu löschen,die durch den Benutzer nicht erwünschtwerden. Bei Schritt 306 werden Verbindungs- bzw. Linksteuerungenhinzugefügt.Eine Inhaltsangabe kann z. B. unter Verwendung geeigneter Verbindungskennungenzu dem Markierungssprachendokument hinzugefügt werden. Die Verbindungssteuerungenliefern die Funktionalitäteiner graphischen Benutzerschnittstelle, um es dem Benutzer zu ermöglichen,einen Abschnittsidentifizierer auszuwählen, um zu dem Abschnitt desMarkierungssprachendokuments zu navigieren, der dem Abschnittsidentifiziererzugeordnet ist. Bei Schritt 307 werden Seitenrollsteuerungen zuder Markierungssprachendatei hinzugefügt, um eine Benutzernavigationdes Dokuments zu ermöglichen.Bei Schritt 308 werden Suchsteuerungen und ein ausführbarerCode, die eine Benutzernavigation des Dokuments ermöglichen,zu der Datei hinzugefügt.Weitere Elemente einer graphischen Benutzerschnittstelle können zuder Markierungssprachendatei hinzugefügt werden, wie dies für den jeweiligenerwünschtenInhalt geeignet ist.
[0021] 4 stellt eine Browseranzeige 400 eines Dokumentsdar, das gemäß repräsentativenAusführungsbeispielenerzeugt wird. Die Anzeige 400 weist einen Inhaltsabschnitt 401 auf,in dem der Text, Linienzeichnung und graphische Bilder des erzeugten Dokumentsangezeigt sind. Die Anzeige 400 liefert eine graphischeBenutzerschnittstelle füreine Benutzernavigation des Dokuments, das sich innerhalb der Browseranzeigebefindet. Die graphische Benutzerschnittstelle weist einen Verbindungsabschnitt 402, Seitensteuerungen 403,ein Suchtextfeld 404 und einen Suchknopf 405 auf.Der Verbindungsabschnitt 402 weist eine Mehrzahl von Abschnittsidentifizierern auf,wie z. B. als Kapitel 1 bis 10 gezeigt ist. Durch ein Auswählen einesder Abschnittsidentifizierer kann der Benutzer in dem Dokument navigieren.Insbesondere wird, wenn der Benutzer einen der Abschnittsidentifiziererauswählt,der entsprechende Teil des Dokuments in dem Inhaltsabschnitt 401 angezeigt.Die Anzeige 400 weist ferner Seitenwechselsteuerungen 403 auf,die es dem Benutzer ermöglichen,wie erwünschtdurch das Dokument zu blättern unddadurch zu bewirken, daß unterschiedlicheTeile des Dokuments in dem Inhaltsabschnitt 401 angezeigtwerden. Die Anzeige 400 weist ferner ein Suchtextfeld 404 zumEmpfangen einer Benutzerabfrage und einen Suchknopf 405 zumAktivieren der Suchlogik auf. Ein JAVASCRIPTTM kannz. B. zur Implementierung der Suchlogik in dem erzeugten Dokumenteingebettet sein. Das Skript parst bzw. analysiert die Benutzerabfrage,die in das Suchtextfeld 404 eingegeben ist, und identifiziert übereinstimmende Abschnitteeines Inhalts des Dokuments in bezug auf die optisch erkannten Zeichen.Das Skript bewirkt dann, daß derInhaltsabschnitt 401 einen Teil des Dokuments, der mitder Benutzerabfrage übereinstimmt,anzeigt.
[0022] Durchein Durchführendes Verarbeitungsflusses, der in 3 dargestelltist, ermöglichenrepräsentativeAusführungsbeispieledie Erzeugung eines Dokuments, das seine eigene graphische Benutzerschnittstelleaufweist. Als ein Ergebnis kann der Benutzer ohne Einschränkung aufdie Funktionalität derAnwendung (z. B. Browser), die zur Betrachtung der Anwendung verwendetwird, durch das Dokument navigieren. Statt dessen kann die graphische Benutzerschnittstellebasierend auf dem Inhalt des Dokuments und den Wünschen des Dokumentenveröffentlicherskundenspezifisch sein. Ferner wird das Dokument in einem Formaterzeugt, das auf keinen gesetzlich geschützten Standard eingeschränkt ist. Folglichkann das erzeugte Dokument auf im wesentlichen die gleiche Art undWeise auf jeder geeigneten Plattform angezeigt werden, ohne daß der Benutzer eineLizenz füreine gesetzlich geschützteSoftwareanwendung erwerben müßte.
权利要求:
Claims (20)
[1] Verfahren zum Erzeugen eines elektronisch veröffentlichbarenDokuments, mit folgenden Schritten: Empfangen (201)von Bilddaten, die einem physischen Dokument entsprechen; Segmentieren(202, 203, 204) der Bilddaten; Erzeugen(301) einer Markierungssprachendatei, die die segmentiertenBilddaten enthält;und Einbetten einer graphischen Benutzerschnittstelle in dieMarkierungssprachendatei, die eine Navigation zu segmentierten Bilddaten,wie dies durch den Benutzer ausgewählt wird, ermöglicht.
[2] Verfahren gemäß Anspruch1, das ferner folgenden Schritt aufweist: Durchführen (205)einer Verarbeitung einer optischen Zeichenerkennung (OCR) der segmentierten Bilddaten.
[3] Verfahren gemäß Anspruch2, das ferner folgenden Schritt aufweist: Durchsuchen (304)der Textdaten, die aus der OCR-Verarbeitung erzeugt werden, zurIdentifizierung von Abschnittsidentifizierern.
[4] Verfahren gemäß Anspruch3, das ferner folgenden Schritt aufweist: Erzeugen (306)einer Mehrzahl von Verbindungen in der Markierungssprachendateiunter Verwendung der Abschnittsidentifizierer, um eine Benutzernavigationzu den segmentierten Bilddaten, die den Abschnittsidentifizierernzugeordnet sind, zu ermöglichen.
[5] Verfahren gemäß Anspruch4, bei dem die Mehrzahl von Verbindungen in einem Inhaltsangabenabschnittder Markierungssprachendatei erzeugt wird.
[6] Verfahren gemäß einemder Ansprüche2 bis 5, bei dem das Einbetten einer graphischen Benutzerschnittstellefolgenden Schritt aufweist: Einbetten (308) einesSkripts in die Markierungssprachendatei, das eine Suche eines Dokumententexts ansprechendauf Suchabfragen durchführt.
[7] Verfahren gemäß einemder Ansprüche1 bis 6, bei dem das physische Dokument ein Mehrseitendokument ist,wobei das Verfahren ferner folgenden Schritt aufweist: Erzeugen(302) von Seitenidentifizierern innerhalb der Markierungssprachendatei.
[8] Verfahren gemäß Anspruch7, bei dem das Einbetten einer graphischen Benutzerschnittstelle folgendenSchritt aufweist: Bereitstellen (307) von Benutzersteuerungenzur Ermöglichungeiner Benutzernavigation gemäß den Seitenidentifizierern.
[9] Verfahren gemäß einemder Ansprüche1 bis 8, bei dem das Einbetten einer graphischen Benutzerschnittstellefolgende Schritte aufweist: Empfangen einer manuellen Identifizierungeiniger der segmentierten Bilddaten; und Erzeugen von Verbindungeninnerhalb der Markierungssprachendatei, um eine Benutzernavigationzu den manuell identifizierten der segmentierten Bilddaten zu ermöglichen.
[10] Computerlesbares Medium, das ausführbare Instruktionenzum Erzeugen eines elektronisch veröffentlichbaren Dokuments enthält, wobeidas computerlesbare Medium folgende Merkmale aufweist: einenCode zum Segmentieren (202, 203, 204)von Bilddaten eines physischen Dokuments; einen Code zum Erzeugen(301) einer Markierungssprachendatei; einen Code zumEinkapseln der segmentierten Bilddaten in die Markierungssprachendatei;und einen Code zum Einbetten einer graphischen Benutzerschnittstellein die Markierungssprachendatei, die eine Navigation zu den segmentiertenBilddaten ansprechend auf eine Benutzereingabe ermöglicht.
[11] Computerlesbares Medium gemäß Anspruch 10, das ferner folgendesMerkmal aufweist: einen Code zum Erzeugen einer Textdatei ausBilddaten, die durch den Code zum Segmentieren segmentiert sind.
[12] Computerlesbares Medium gemäß Anspruch 11, das ferner folgendesMerkmal aufweist: einen Code zum Erzeugen einer Suchsteuerunginnerhalb der Markierungssprachendatei, um eine Benutzernavigationgemäß Textabfragenzu ermöglichen.
[13] Computerlesbares Medium gemäß Anspruch 11 oder 12, dasferner folgende Merkmale aufweist: einen Code zum Durchsuchender Textdatei zur Identifizierung von Schlüsselwörtern, die einen Abschnitt desphysischen Dokuments anzeigen; und einen Code zum Erzeugenvon Verbindungen in dem Markierungssprachendokument, um eine Benutzernavigationzu segmentierten Bilddaten zu ermöglichen, die Schlüsselwörtern entsprechen,die durch den Code zum Durchsuchen identifiziert sind.
[14] Computerlesbares Medium gemäß einem der Ansprüche 10 bis13, das ferner folgendes Merkmal aufweist: einen Code zum Erzeugenvon Markierungssprachenkennungen in der Markierungssprachendatei, umsegmentierte Bilddaten anzuzeigen, die Seiten des physischen Dokumentsentsprechen.
[15] Computerlesbares Medium gemäß Anspruch 14, das ferner folgendesMerkmal aufweist: einen Code zum Einbetten einer Benutzersteuerung indie Markierungssprachendatei, um eine Benutzernavigation zu einerausgewähltenSeite zu ermöglichen.
[16] Computerlesbares Medium gemäß Anspruch 14 oder 15, dasferner folgendes Merkmal aufweist: einen Code zum Einbetteneiner Benutzersteuerung in die Markierungssprachendatei, um eineBenutzernavigation vorwärtsoder rückwärts gemäß den Markierungssprachenkennungenzu ermöglichen,die segmentierte Bilddaten anzeigen, die Seiten des physischen Dokumentsentsprechen.
[17] Computerlesbares Medium gemäß einem der Ansprüche 10 bis16, bei dem der Code zum Segmentieren (202, 203, 204)Bilddaten segmentiert, die Textelementen, Linienzeichnungselementenund graphischen Bildelementen entsprechen.
[18] System zum Erzeugen eines elektronisch veröffentlichbarenDokuments, mit folgenden Merkmalen: einer Einrichtung zum Bereitstellenvon Bilddaten; einer Einrichtung zum Durchführen einer Seitensegmentierungbezüglichder Bilddaten; einer Einrichtung zum Erzeugen einer Markierungssprachendatei,die segmentierte Daten enthält,die durch die Einrichtung zum Durchführen einer Seitensegmentierungerzeugt werden; und einer Einrichtung zum Einbetten einer graphischen Benutzerschnittstellein die Markierungssprachendatei, um eine Navigation zu den segmentiertenDaten gemäß einerBenutzereingabe zu ermöglichen.
[19] System gemäß Anspruch18, das ferner folgendes Merkmal aufweist: eine Einrichtungzum Durchführeneiner Verarbeitung einer optischen Zeichenerkennung (OCR) bezüglich Textdaten,die durch die Einrichtung zum Durchführen einer Seitensegmentierungsegmentiert werden.
[20] System gemäß Anspruch19, das ferner folgendes Merkmal aufweist: eine Einrichtungzum Einbetten eines Suchskripts in die Markierungssprachendatei,das betreibbar ist, um Textdaten zu durchsuchen, die durch die Einrichtung zumDurchführeneiner OCR-Verarbeitung erzeugt werden, um eine Navigation zu einigender segmentierten Daten gemäß Suchabfragenzu ermöglichen.
类似技术:
公开号 | 公开日 | 专利标题
US10073859B2|2018-09-11|System and methods for creation and use of a mixed media environment
EP2462520B1|2014-07-02|Architektur für die antwort auf eine visuelle abfrage
US7577295B2|2009-08-18|Markup symbol document processing system
US7278117B2|2007-10-02|Image segmentation and warping for specialized display viewing
EP0539106B1|2002-08-21|Elektronisches Datenliefersystem
US7428701B1|2008-09-23|Method, system and computer program for redaction of material from documents
JP5095535B2|2012-12-12|画像処理方法、画像処理システム、画像処理装置及びプログラム
US7552381B2|2009-06-23|Check boxes for identifying and processing stored documents
AU2017272149B2|2019-01-24|Identifying matching canonical documents in response to a visual query
US8683003B2|2014-03-25|Hyperlink with graphical cue
KR100980748B1|2010-09-07|혼합 미디어 환경을 생성 및 사용하는 시스템 및 방법
KR101037458B1|2011-05-26|화상 처리 장치, 화상 처리 방법 및 기억 매체
US9280952B2|2016-03-08|Selective display of OCR'ed text and corresponding images from publications on a client device
US6389435B1|2002-05-14|Method and system for copying a freeform digital ink mark on an object to a related object
JP4118349B2|2008-07-16|文書選択等の方法及び文書サーバ
US8179556B2|2012-05-15|Masking of text in document reproduction
US8811742B2|2014-08-19|Identifying matching canonical documents consistent with visual query structural information
US7865042B2|2011-01-04|Document management method using barcode to store access history information
US8892906B2|2014-11-18|Method and apparatus for improved information transactions
US8869023B2|2014-10-21|Conversion of a collection of data to a structured, printable and navigable format
JP4344693B2|2009-10-14|ブラウザの文書編集のためのシステムおよびその方法
US8593666B2|2013-11-26|Method and system for printing a web page
US7519906B2|2009-04-14|Method and an apparatus for visual summarization of documents
US10192279B1|2019-01-29|Indexed document modification sharing with mixed media reality
US7991778B2|2011-08-02|Triggering actions with captured input in a mixed media environment
同族专利:
公开号 | 公开日
GB0418974D0|2004-09-29|
US20050050452A1|2005-03-03|
GB2405508A|2005-03-02|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2005-04-07| OP8| Request for examination as to paragraph 44 patent law|
2008-11-06| 8131| Rejection|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]