DE102008030125A1 - Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks - Google Patents

Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks Download PDF

Info

Publication number
DE102008030125A1
DE102008030125A1 DE102008030125A DE102008030125A DE102008030125A1 DE 102008030125 A1 DE102008030125 A1 DE 102008030125A1 DE 102008030125 A DE102008030125 A DE 102008030125A DE 102008030125 A DE102008030125 A DE 102008030125A DE 102008030125 A1 DE102008030125 A1 DE 102008030125A1
Authority
DE
Germany
Prior art keywords
search
terms
text
neuron
activation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102008030125A
Other languages
German (de)
Inventor
Christina Kluever
Juergen Kluever
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kluever Christina Dr
Kluever Juergen Prof Dr
Original Assignee
Kluever Christina Dr
Kluever Juergen Prof Dr
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kluever Christina Dr, Kluever Juergen Prof Dr filed Critical Kluever Christina Dr
Priority to DE102008030125A priority Critical patent/DE102008030125A1/en
Publication of DE102008030125A1 publication Critical patent/DE102008030125A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Abstract

The method involves specifying multiple search items and generating two neuronal networks. The search words are assigned to a neuron of the network such that combining weights are kept constant with the neuronal network and the neurons are activated in dependence of the frequency of the search word in the text to be evaluated. The search words are assigned to the neuron such that combining weights depends in frequency of the search word in the text with another neuronal network and the activation of the neurons is kept constant, and end activation of both the networks is calculated. Independent claims are also included for the following: (1) a search and evaluation system for evaluation of electronically stored text (2) a computer program product for evaluation of electronically stored text.

Description

Die Erfindung betrifft ein Such- und Auswerteverfahren zur Auswertung von elektronisch gespeicherten Texten mittels eines Computersystems und neuronaler Netze unter Verwendung von vorgebbaren oder zuvor ermittelten Suchbegriffen, wobei ein jedes Neuron eine Aktivierung aufweist und über eine gewichtete Verbindung mit zumindest einem anderen Neuron verbunden ist, wobei das Produkt aus der Aktivierung des Neurons mit dem Verbindungsgewicht eine Endaktivierung bildet. Des Weiteren betrifft die Erfindung ein Such- und Auswertesystem zur Auswertung von elektronisch gespeicherten Texten, insbesondere zur Anwendung des Verfahrens, aufweisend eine Benutzerschnittstelle zum Erhalt von Suchbegriffen, sowie eine Suchmaschinenschnittstelle zur Veranlassung einer Suche unter Verwendung der Suchbegriffe und zum Erhalt des Resultates der Suche und der aufgefundenen Texte.The The invention relates to a search and evaluation method for evaluation electronically stored texts by means of a computer system and neural networks using predeterminable or previously determined search terms, wherein each neuron activation and over a weighted connection associated with at least one other neuron , wherein the product of activation of the neuron with the compound weight is a Final activation forms. Furthermore, the invention relates to a search engine and evaluation system for the evaluation of electronically stored Texts, in particular for the application of the method, comprising a User interface for obtaining search terms, as well as a search engine interface to initiate a search using the search terms and to obtain the result of the search and the found texts.

Es sind verschiedenste Such- und Auswerteverfahren zur Auswertung von elektronisch gespeicherten Texten mittels eines Computersystems bekannt. Üblicherweise werden dabei unter Verwendung von einem oder mehreren Suchbegriffen elektronisch gespeicherte Texte nach diesen Begriffen durchsucht und anschließend in Ergebnislisten aufgeführt.It are various search and evaluation methods for the evaluation of electronically stored texts by means of a computer system known. Usually are doing using one or more keywords electronically stored texts searched for these terms and subsequently listed in result lists.

Ebenfalls bekannt sind neuronale Netze, bei denen ein jedes Neuron eine Aktivierung aufweist und über eine gewichtete Verbindung mit zumindest einem anderen Neuron verbunden ist, wobei das Produkt aus der Aktivierung des Neurons mit dem Verbindungsgewicht eine Endaktivierung bildet.Also Neural networks are known in which each neuron activates and over a weighted connection associated with at least one other neuron is, where the product of the activation of the neuron with the compound weight forms an end activation.

Nachteilig bei den bekannten Suchverfahren ist, es dass lediglich die Tatsache, dass ein Suchbegriff in dem durchsuchten Text enthalten ist, aus der Ergebnisliste erschlossen werden kann, es erfolgt jedoch keine Auswertung der Texte hinsichtlich ihrer Relevanz in Bezug auf die verwendeten Suchbegriffe. Dadurch dass keine Sortierung hinsichtlich der Relevanz erfolgt, werden zum Teil unbrauchbare Ergebnislisten mit einer unüberschaubar großen Trefferanzahl erzeugt, die aufgrund der Listenlänge unbrauchbar sind.adversely with the known search methods, it's just that the fact that a search term is included in the searched text the result list can be opened, however, there are none Evaluation of the texts in terms of their relevance to the used search terms. By not sorting in terms of relevance takes place, are sometimes unusable result lists with an unmanageable huge Number of hits generated, which are useless due to the list length.

Die Aufgabe der Erfindung ist es, ein Verfahren und ein System zur Suche und Auswertung elektronisch gespeicherter Texte bereitzustellen, mittels dessen eine Ermittlung und Darstellung der Relevanz eines durchsuchten und ausgewerteten Textes in Bezug auf die verwendeten Suchbegriffe ermöglicht wird, um insbesondere eine Sortierung der durchsuchten und ausgewerteten Texte nach Relevanz zu ermöglichen.The The object of the invention is to provide a method and a system for searching and evaluate electronically stored texts, by means of which a determination and representation of the relevance of a searched and evaluated text in relation to the used Search terms is enabled, in particular a sorting of the searched and evaluated To enable texts according to relevance.

Diese Aufgabe wird erfindungsgemäß durch ein Verfahren gemäß Anspruch 1 sowie ein System gemäß Anspruch 8 gelöst. Vorteilhafte Weiterbildungen des erfindungsgemäßen Verfahrens sowie des erfindungsgemäßen Systems sind in den abhängigen Ansprüchen angegeben.These The object is achieved by a Method according to claim 1 and a system according to claim 8 solved. Advantageous developments of the method according to the invention and of the system according to the invention are in the dependent claims specified.

Besonders vorteilhaft bei dem erfindungsgemäßen Such- und Auswerteverfahren zur Auswertung von elektronisch gespeicherten Texten mittels eines Computersystems und neuronaler Netze unter Verwendung von vorgebbaren oder zuvor ermittelten Suchbegriffen, wobei ein jedes Neuron eine Aktivierung aufweist und über eine gewichtete Verbindung mit zumindest einem anderen Neuron verbunden ist, wobei das Produkt aus der Aktivierung des Neurons mit dem Verbindungsgewicht eine Endaktivierung bildet, ist es, dass mehrere Suchbegriffe vorgegeben werden und zumindest zwei neuronale Netze generiert werden, wobei jeder Suchbegriff jeweils einem Neuron eines jeden Netzes zugeordnet wird, wobei bei dem ersten neuronalen Netz die Verbindungsgewichte konstant sind und die Aktivierung eines jeden Neurons in Abhängigkeit der Häufigkeit des Suchbegriffes im auszuwertenden Text erfolgt, und wobei bei dem zweiten neuronalen Netz die Verbindungsgewichte in Abhängigkeit der Häufigkeit des Suchbegriffes im auszuwertenden Text sind und die Aktivierung konstant ist, und eine Berechnung der jeweiligen Endaktivierungen beider Netze erfolgt.Especially advantageous in the search and evaluation method according to the invention for the evaluation of electronically stored texts by means of a Computer system and neural networks using predeterminable or previously determined search terms, each neuron containing a Activation and over a weighted connection associated with at least one other neuron is, where the product of the activation of the neuron with the compound weight is an end activation, it is that multiple search terms are given and at least two neural networks are generated, each one Keyword is assigned to a neuron of each network, wherein, in the first neural network, the connection weights are constant are and the activation of each neuron depending the frequency the search term is carried out in the text to be evaluated, and wherein in the second neural network the connection weights in dependence the frequency of the search term in the text to be evaluated and the activation is constant and a calculation of the respective end activations both networks takes place.

Unter dem Begriff eines elektronisch gespeicherten Textes ist dabei jede elektronisch gespeicherte Datei enthaltend Daten und/oder Zeichenfolgen zu subsumieren. Unter dem Begriff eines Suchbegriffes sind dabei Wörter oder Wortteile einer natürlichen Sprache oder jedwede sonstige beliebige Zeichenfolge zu subsumieren. Da auch Wortteile einer natürlichen Sprache Verwendung finden können, können somit auch beliebige Trunkierungen bei der Suche und Auswertung zugelassen werden, d. h. dass die benutzten Suchbegriffe insbesondere am Beginn und/oder am Ende mit einem Platzhalter versehen sein können.Under The concept of an electronically stored text is each electronically stored file containing data and / or strings to subsume. Under the term of a search term are here words or parts of a natural word Language or any other arbitrary string. Since also word parts of a natural Thus language can be used also any Trunkierungen in the search and evaluation allowed be, d. H. that used search terms especially at the beginning and / or can be provided with a placeholder at the end.

Vorzugsweise wird für jeden Suchbegriff der arithmetische Mittelwert aus beiden Endaktivierungen ermittelt. Dieser Mittelwert kann als Maß für die Bedeutung des Begriffes für die analysierte Datei respektive umgekehrt als Maß für die Relevanz des Textes in Bezug auf den Suchbegriff dienen und insbesondere für weitere Auswertungen und/oder Ergebnisdarstellungen herangezogen werden.Preferably is for each search term is the arithmetic mean of both end activations determined. This mean can be used as a measure of the meaning of the term for the Analyzed file or vice versa as a measure of the relevance of the text in Reference to the search term and in particular for more Evaluations and / or results representations are used.

Durch die Berücksichtigung beider Endaktivierungen kann ein zuverlässiges Maß für die Relevanz der analysierten Datei in Bezug auf den verwendeten Suchbegriff abgeleitet werden.By the consideration Both end activations can be a reliable measure of the relevance of the analyzed File in relation to the search term used.

Bevorzugt wird eine Sortierung der Suchbegriffe nach absteigender Endaktivierung durchgeführt, d. h. dass jenen Suchbegriffen eine größere Beadeutung zugemessen wird, deren jeweilige Endaktivierung größer ist, gegenüber solchen Suchbegriffen mit einer kleineren Endaktivierung.Preferably, a sorting of the search terms durchge after decreasing end activation This means that those search terms are given a larger bea-interpretation whose respective final activation is greater than those search terms with a smaller final activation.

In einer bevorzugten Ausführungsform des Verfahrens handelt es sich bei den Suchbegriffen um mittels einer vorhergehenden Suche unter Verwendung eines ersten Suchbegriffes ermittelten korrespondierende weitere Begriffe.In a preferred embodiment In the process, the search terms are by means of a previous search using a first search term determined corresponding additional terms.

Vorzugsweise wird nach der Auswertung von mehreren Texten eine Rangliste der Texte nach Relevanz gebildet, wobei die Relevanz aus der Endaktivierung eines oder beider neuronaler Netze und/oder aus einem Mittelwert der Endaktivierungen beider neuronaler Netze abgeleitet wird.Preferably is after the evaluation of several texts a ranking of the Texts are formed by relevance, with the relevance of the final activation one or both neural networks and / or from an average derived from the end activations of both neural networks.

Bevorzugt sind mittels einer vorgebbaren Negativliste bestimmte Begriffe von einer Suche und/oder Auswertung ausnehmbar. Hierdurch können triviale Resultate durch das vorherige Ausnehmen bestimmter Begriffe oder Zeichenfolge vermieden werden.Prefers are by means of a predetermined negative list certain terms of a search and / or evaluation removed. This can be trivial Results by previous exclusion of certain terms or String can be avoided.

Vorzugsweise werden mittels einer ersten Anwendung des Verfahrens korrespondierende Suchbegriffe zur Erweiterung der Suche ermittelt, mittels derer unter erneuter Anwendung des Verfahrens iterativ eines oder mehrere weitere Paare von neuronalen Netzen erzeugt und deren Endaktivierungen ermittelt werden.Preferably become by a first application of the method corresponding search terms to extend the search, by means of which under renewed Application of the method iteratively one or more other pairs generated by neural networks and determines their end activations become.

Durch eine iterative Anwendung des Verfahrens können zum einen korrespondierende Suchbegriffe, die im Kontext der primär verwendeten Suchparameter stehen identifiziert werden, und zum anderen die Qualität der Suche und Auswertung enorm verbessert werden.By an iterative application of the method can on the one hand corresponding Search terms used in the context of the search parameters used primarily be identified and, secondly, the quality of the search and evaluation are greatly improved.

Besonders vorteilhaft bei dem erfindungsgemäßen Such- und Auswertesystem zur Auswertung von elektronisch gespeicherten Texten, insbesondere zur Anwendung des erfindungsgemäßen Verfahrens, aufweisend eine Benutzerschnittstelle zum Erhalt von Suchbegriffen, sowie eine Suchmaschinenschnittstelle zur Veranlassung einer Suche unter Verwendung der Suchbegriffe und zum Erhalt des Resultates der Suche und der aufgefundenen Texte, ist es, dass das System einen Netzgenerator aufweist, mittels dessen zumindest zwei neuronale Netze generiert werden, wobei ein jedes Neuron eine Aktivierung aufweist und über eine gewichtete Verbindung mit zumindest einem anderen Neuron verbunden ist, wobei das Produkt aus der Aktivierung des Neurons mit dem Verbindungsgewicht eine Endaktivierung bildet, wobei jeder Suchbegriff jeweils einem Neuron eines jeden Netzes zugeordnet wird, und wobei eine Textauswerteeinheit vorgesehen ist, mittels derer die absoluten und/oder relativen Häufigkeiten der Suchbegriffe in einem Text ermittelt und an den Netzgenerator übergeben werden, wobei mittels des Netzgenerators bei dem ersten neuronalen Netz die Aktivierung eines jeden Neurons in Abhängigkeit der Häufigkeit des zugeordneten Suchbegriffes bei konstanten Verbindungsgewichten und bei dem zweiten neuronalen Netz die Verbindungsgewichte in Abhängigkeit der Häufigkeit des zugeordneten Suchbegriffes bei konstanter Aktivierung durchgeführt wird und die jeweiligen Endaktivierungen ermittelt werden, und aufweisend eine Ausgabeeinheit, mittels derer die Endaktivierungen der neuronalen Netze ausgegeben werden.Especially advantageous in the search and evaluation system according to the invention for the evaluation of electronically stored texts, in particular for the application of the method according to the invention, having a user interface for obtaining search terms, and a search engine interface for initiating a search using the search terms and to get the result the search and the found texts, it is that the system has one Net generator, by means of which at least two neural Nets are generated, with each neuron having an activation and over a weighted connection associated with at least one other neuron is, where the product of the activation of the neuron with the compound weight forms an end activation, each search term corresponding to one Neuron is assigned to each network, and wherein a text evaluation unit is provided by means of which the absolute and / or relative frequencies The search terms are determined in a text and passed to the network generator be, by means of the network generator at the first neural Net the activation of each neuron depending on the frequency of assigned search term at constant connection weights and in the second neural network, the connection weights in dependence the frequency the associated search term is carried out at constant activation and determining the respective end activations, and having an output unit, by means of which the end activations of the neural Networks are output.

Vorzugsweise weist das System eine graphische Benutzerschnittstelle auf, mittels derer die Endaktivierungen der beiden neuronalen Netze in Bezug auf die verwendeten Suchbegriffe graphisch dargestellt werden bzw. darstellbar sind.Preferably the system has a graphical user interface by means of and the end activations of the two neural networks with respect to the search terms used are displayed graphically or representable are.

Hierdurch kann die Relevanz der analysierten Texte und Dateien sowie die Relevanz der verwendeten Suchbegriffe zueinander in vorteilhafter und leicht verständlicher Weise abgebildet werden.hereby can the relevance of the analyzed texts and files as well as the relevance the search terms used to each other in an advantageous and easy understandable Be mapped way.

Besonders bevorzugt weist das System eine Benutzerschnittstelle auf, mittels derer eine Erläuterung in einer natürlichen Sprache über die Relevanz der Suchbegriffe in Bezug auf den ausgewerteten Text ausgegeben wird, wobei die Erläuterung mittels der Textauswerteeinheit aus den Endaktivierungen der beiden neuronalen Netze in Bezug auf die verwendeten Suchbegriffe generiert und.Especially Preferably, the system has a user interface by means of an explanation in a natural Language over the relevance of the search terms in relation to the evaluated text is output, the explanation by means of the text evaluation unit from the end activations of the two neural networks generated in relation to the search terms used and.

Durch das automatische Generieren eines Erklärungstextes in natürlicher Sprache erfolgt quasi eine Übersetzung des numerischen Analyseergebnisses in ein unmittelbar verständliches Resultat, dem die Relevanz der verwendeten Suchbegriffe entnehmbar ist.By the automatic generation of a declaration text in natural Language is almost a translation of the numerical analysis result into a directly understandable one Result from which the relevance of the search terms used can be deduced is.

Bevorzugt wird mittels der Ausgabeeinheit eine Rangliste einer Mehrzahl von ausgewerteten Texten gebildet und ausgegeben, wobei die Rangliste sich nach der Relevanz der Texte in Bezug auf die Suchbegriffe richtet.Prefers By means of the output unit, a ranking list of a plurality of Evaluated texts are formed and output, with the rankings depending on the relevance of the texts in relation to the search terms.

Vorzugsweise weist das System Datenspeicherungsmittel zur Abspeicherung und/oder Zwischenspeicherung der Suchbegriffe und/oder der aufgefundenen und/oder ausgewerteten Texte und/oder der neuronalen Netze sowie Netzparameter und/oder von Ranglisten auf. Durch die Anordnung von flüchtigen und/oder dauerhaften Datenspeichern können die verschiedenen Dateien, Parameter, Ergebnisse, etc. stets schnell verfügbar vorgehalten werden.Preferably the system has data storage means for storage and / or Caching of search terms and / or the found and / or evaluated texts and / or neural networks as well Network parameters and / or ranking lists. Due to the arrangement of volatile and / or permanent data stores, the various files, Parameters, results, etc. are always kept readily available.

Besonders bevorzugt ist eine Schnittstelle zum Erhalt von durch eine vorhergehende Suche ermittelten zu den ersten Suchbegriffen korrespondierenden weiteren Begriffen vorgesehen, wobei unter Verwendung der weiteren Begriffe das erste und zweite gebildete neuronale Netz erweitert und/oder ein drittes und viertes neuronales Netz mittels dem Netzgenerator gebildet wird. Es besteht hierdurch die Möglichkeit einer iterativen Anwendung und/oder vertieften und/oder erweiterten Suche mittels des erfindungsgemäßen Systems.Particularly preferred is an interface for obtaining it by a previous search averaging provided to the first search terms corresponding further terms, wherein using the further terms, the first and second formed neural network expanded and / or a third and fourth neural network is formed by means of the network generator. There is thus the possibility of an iterative application and / or in-depth and / or extended search by means of the system according to the invention.

Vorzugsweise ist ein Filter vorgesehen, mittels dessen eine vorgebbare Negativliste von Begriffen von einer Suche und/oder Auswertung ausnehmbar ist, um dadurch Trivialergebnisse zu vermeiden, wie beispielsweise die Berücksichtigung eines Artikels oder eines Bindewortes einer natürlichen Sprache, da hierdurch das Ergebnis der Datenanalyse stark verfälscht werden könnte.Preferably a filter is provided by means of which a definable negative list of terms of a search and / or evaluation is removable, to avoid trivial results, such as the consideration an article or a verb of a natural language, thereby the result of the data analysis could be strongly distorted.

Mittels des erfindungsgemäßen Verfahrens und des erfindungsgemäßen Systems können somit insbesondere die Suchergebnisse von Internet-Suchmaschinen ausgewertet werden, d. h. dass das Verfahren und das System insbesondere in Form einer so genannten Meta-Suchmaschine, die für eine erste Suche auf andere, externe Suchmaschinen zurückgreift, betrieben werden kann. Es kann jedoch auch eine Primärsuchfunktion integriert sein, so dass nicht zunächst auf externe Suchmaschinen zurückgegriffen werden muss, sondern bereits die Primärsuche eigenständig durchgeführt wird.through the process of the invention and of the system according to the invention can thus in particular the search results of Internet search engines be evaluated, d. H. that the procedure and the system in particular in the form of a so-called meta-search engine, which is for a first Search on other, external search engines resorting to, operated can. However, a primary search function can also be integrated, so not first resorted to external search engines must be, but already the primary search is carried out independently.

Bei dem dargestellten Ausführungsbeispiel bildet das erfindungsgemäße System eine Meta-Suchmaschine. Eine Meta-Suchmaschine ist ein Programm, das auf bereits vorhandenen Suchmaschinen wie beispielsweise Google oder Yahoo oder dergleichen operiert. Ziel der Suche ist die Angabe von Texten. Vorzugsweise wird das Verfahren und das System in einem Computernetzwerk wie das Internet ausgeführt bzw. integriert. Die erforderlichen Schnittstellen zur Eingabe und Ausgabe von Daten stehen somit zur Verfügung.at forms the illustrated embodiment the system according to the invention a meta search engine. A meta-search engine is a program that on existing search engines such as Google or Yahoo or the like. The aim of the search is the specification of Texts. Preferably, the method and the system in one Computer network such as the Internet running or integrated. The required interfaces for input and output of data are thus available.

Wenn also ein Benutzer einen oder mehrere Suchbegriffe in das erfindungsgemäße System eingibt, dann wird automatisch mindestens eine Suchmaschine, gewöhnlich Google, mit der Erstsuche beauftragt. Das Auswertesystem übernimmt die von der Suchmaschine angegebenen Texte und beginnt mit seiner eigentlichen Arbeit, nämlich der Auswertung der gefundenen Texte. Die Suchstrategie von z. B. Google wird dabei durch eine Suchanweisung des Programms modifiziert, da Google sich streng an den Vorgaben des Benutzers orientiert und nicht wie üblich an der Häufigkeit, mit der bestimmte Texte bereits aufgerufen wurden. Die vorliegende Meta-Suchmaschine hat zum allgemeinen Ziel, Informationen aus den von den Suchmaschinen gefundenen Texten zu filtern und zu kondensieren.If So a user one or more search terms in the system of the invention then at least one search engine, usually Google, will automatically commissioned with the first search. The evaluation system takes over the texts specified by the search engine and starts with his actual work, namely the evaluation of the found texts. The search strategy of z. Google is modified by a search statement of the program because Google is strictly based on the specifications of the user and not as usual at the frequency, with which certain texts have already been called. The present Meta search engine has the general goal of getting information out of the to filter and condense texts found by search engines.

Konkret operiert das System wie folgt:
Ein Benutzer des Systems wird zu Beginn aufgefordert, zu dem Thema, zu dem er relevante Texte sucht, mehrere Begriffe in einer Reihenfolge einzugeben, die die Relevanz der Begriffe für den Benutzer repräsentiert. Dazu steht eine Schnittstelle zur Verfügung.
Specifically, the system operates as follows:
A user of the system is initially asked to input to the subject for which he or she is searching for relevant texts several terms in an order that represents the relevance of the terms to the user. An interface is available for this purpose.

Eine zweite Eingabemethode ist die der Prioritätslisten. Hier kann jedem Begriff gleichzeitig eine Priorität mitgegeben werden, um so eine erste Struktur festzulegen. Es können somit zu jedem Begriff wahlweise Unterbegriffe zugeordnet werden. Die Darstellung der Begriffe erfolgt in einem Baum dessen Blätter die Begriffe darstellen.A second input method is that of the priority lists. Here every term can be at the same time a priority be given to define a first structure. It can thus For each term optionally sub-terms can be assigned. The representation the terms are in a tree whose leaves represent the concepts.

Alternativ oder kumulativ können die der Ananlyse zugrunde liegenden Suchbegriffe jedoch auch automatisch aus einer elektronischen Datei und/oder von einem Speichermedium ausgelesen und übernommen werden. Der Begriff des Benutzers ist somit lediglich als Synonym für eine Vorgabe beim Start des Prozesses aufzufassen.alternative or cumulatively However, the search terms underlying the analysis are also automatic from an electronic file and / or from a storage medium read out and accepted become. The term of the user is thus merely a synonym for one Specification at the start of the process.

Mittels des erfindungsgemäßen Verfahrens und des erfindungsgemäßen Systems wird nunmehr aus dieser Begriffsliste ein künstliches neuronales Netz konstruiert. Dieses repräsentiert die Zusammenhangsstruktur der Begriffe aus der Sicht des Benutzers und wird im Folgenden als Benutzernetz bzw. Netzagent 1 bezeichnet. Die Einheiten dieses Netzagenten 1 sind die Begriffe, die der Benutzer vorgibt; die Verbindungen zwischen den Einheiten werden als numerische Werte (Gewichte) entweder nach der Reihenfolge der Benutzereingaben oder gemäß der Prioritätenliste in das Netz eingefügt.through the process of the invention and of the system according to the invention Now, an artificial neural network is constructed from this list of terms. This represents the contextual structure of terms from the user's point of view and is referred to below as a user network or network agent 1. The units of this network agent 1 are the terms that the user pretending; the connections between the units are called numeric Values (weights) either according to the order of user input or according to the priority list inserted into the network.

Anschließend ordnet das System die von der Suchmaschine gefundenen Texte in eine Rankingliste. Für dies Ranking wird ein weiterer Agent aktiviert, der als Suchagent bezeichnet wird, da er nach bestimmten Kriterien die Texte untersucht. Der Suchagent orientiert sein Ranking daran, wie repräsentativ die vom Benutzer vorgegebenen Begriffe für den jeweiligen Text sind, nämlich a) zu wie viel Prozent die Begriffe relativ zur Gesamtzahl aller Wörter im Text enthalten sind, b) wie häufig die Begriffe relativ zur Gesamtzahl der Begriffe in einem Text enthalten sind und c) wie gleich verteilt die Begriffe im Text vorkommen. Für das Kriterium c) gilt, dass ein Text umso höher bewertet wird, je homogener die Begriffe im Text vorkommen. Danach beginnt das System mit der Auswertung des Textes, der im Ranking an oberster Stelle steht.Then assigns the system puts the texts found by the search engine into a ranking list. For this Ranking activates another agent called the search agent because it examines the texts according to certain criteria. Of the Search Agent orients its ranking by how representative the are user-defined terms for the respective text, namely a) to what percentage the terms relative to the total number of all words in the text, b) how often contain the terms relative to the total number of terms in a text and c) how equally distributed the terms occur in the text. For the Criterion c) applies that the higher the value, the more homogenous a text is the terms occur in the text. Then the system starts the evaluation the text, which is in the highest ranking in the ranking.

Nach der Auswertung wird der Titel des Dokumentes aufgeführt, eine Kurzbeschreibung (die ersten 300 Zeichen des Dokumentes), die Suchmaschine, die das Ergebnis geliefert hat und der Rankingwert in Form eines grünen Balkens.To the evaluation will list the title of the document, a Short description (the first 300 characters of the document), the search engine, which has delivered the result and the ranking value in the form of a green Bar.

Um das originale Dokument zu betrachten kann der Benutzer entweder auf den Titel klicken oder auf die Schabfläche „Anzeigen”. Es kann auch jeweils eine automatische Anzeige erfolgen. In allen Fällen öffnet sich ein Browserfenster, indem das Dokument dargestellt wird. Unter der Schaltfläche „Details” können detaillierte Informationen über das Dokument abgerufen werden. Diese sollen dem Benutzer eine komplette Durchsicht des Dokumentes ersparen, d. h., er kann unter Umständen aufgrund der dargebotenen Informationen entscheiden, ob es für ihn sinnvoll ist das Dokument im Ganzen anzusehen oder nicht.Around The user can either view the original document click on the title or on the "Show" scrapbook. It can also each one automatic display. In all cases, a browser window opens, by presenting the document. Under the "Details" button can be detailed information about the document will be retrieved. These should give the user a complete To avoid a review of the document, d. h., he may be due to the information presented will decide if it makes sense for him is the document to be considered as a whole or not.

Analog zur Konstruktion des Benutzernetzes konstruiert das System nun aus den Suchbegriffen zwei weitere Netzagenten (Netzagent 2 und Netzagent 3), die als Textnetze bezeichnet werden. Diese Netze geben an, welche Bedeutung die Suchbegriffe im Text haben und zwar auf der Basis ihrer Häufigkeit im Text. Diese Häufigkeit wird in zwei Netzstrukturen übersetzt und das Netz wird „aktiviert”, d. h. es wird in eine Dynamik versetzt. Dies wird dadurch realisiert, dass die Einheiten mit bestimmten numerischen Anfangswerten versehen werden, worauf der dynamische Prozess in Gang gesetzt wird. Das Ergebnis des dynamischen Prozessierens des Netzes, nämlich die Endaktivierungswerte der Begriffe, ist dann die Bedeutung der Begriffe im Text. Diese Bedeutungsgenerierung wird sowohl in Form visueller Graphiken als auch als sprachliche Interpretation ausgegeben. Zusätzlich kann eine Analyse ausgegeben werden, inwieweit die strukturierte Vorgabe von dem Ergebnis der Textanalyse abweicht.Analogous to construct the user network, the system is now designing the search terms two more network agents (network agent 2 and network agent 3), which are called text networks. These nets indicate which ones Meaning the search terms in the text have on the base their frequency in the Text. This frequency is translated into two network structures and the network is "activated", i. H. it is put into a dynamic. This is realized by that the units are provided with certain initial numerical values whereupon the dynamic process is set in motion. The Result of the dynamic processing of the network, namely the End-activation values of the terms, then the meaning of the terms in the text. This generation of meaning is in the form of visual graphics as well as a linguistic interpretation. In addition, can an analysis will be issued, to what extent the structured specification deviates from the result of the text analysis.

Die beiden Netzagenten unterscheiden sich darin, dass Netzagent 2 gleiche Verbindungswerte von 0.5 von und zu allen Einheiten hat. Die Dynamik des Netzagenten 2 entsteht dann dadurch, dass die Einheiten mit Werten aktiviert werden, die der Häufigkeit der Begriffe im Text entsprechen. Beim Netzagenten 3 werden die Werte der Verbindungen proportional zur Häufigkeit im Text festgelegt, während die Aktivierung durch gleiche numerische Werte geschieht. Die jeweiligen Endaktivierungen der beiden Netzagenten werden als Kurven dargestellt, die sich in der Verlaufsform entsprechen. Da die absoluten Endwerte gewöhnlich differieren, wird der arithmetische Mittelwert gebildet, der als Bedeutung interpretiert wird.The Both network agents differ in that Network Agent 2 is the same Has connection values of 0.5 from and to all units. The dynamics of Network Agent 2 is created by the units with values be activated according to the frequency correspond to the terms in the text. At the network agent 3, the Values of the connections are set proportional to the frequency in the text, while the activation happens by equal numerical values. The respective ones End activations of the two network agents are displayed as curves, which correspond in the form of progression. Because the absolute end values usually differ, the arithmetic mean is calculated as Meaning is interpreted.

Da derartige Kurven für ungeübte Benutzer gewöhnlich nur schwer zu verstehen sind, werden die Kurven in eine umgangssprachliche Erläuterung übersetzt.There such curves for untrained User usually are difficult to understand, the curves are in a colloquial Explanation translated.

Die bisher beschriebenen Programmteile und -operationen bilden den ersten Teil des Gesamtsystems. Der Übersichtlichkeit halber werden die einzelnen Komponenten noch einmal schematisch dargestellt:The previously described program parts and operations make up the first Part of the overall system. The clarity half the individual components are again schematic shown:

Komponentenliste 1:Component list 1:

  • a) Schnittstelle für den Benutzer zur Eingabe von eigenen Begriffen sowie für die Ausgaben der Ergebnisse an den Benutzer;a) Interface for the user to enter of own terms as well as for the outputs of the results to the user;
  • b) Werkzeug „Suche” zur Anweisung an eine Suchmaschine für eine spezielle Form der Suche (= Modifikation der Operationen der Suchmaschine);b) "Search" tool for instruction to a search engine for a special form of search (= modification of the operations of Search engine);
  • c) Werkzeug „Agentenkonstruktionen”;c) tool "Agent Constructions";
  • d) Netzagent 1 (Benutzernetz);d) network agent 1 (user network);
  • e) Analyseagent zur Konstruktion eines Ranking, was die Grundlage für die Konstruktion der Netzagenten ist; e) analysis agent to construct a ranking, what the foundation for the Construction of the network agents is;
  • f) Netzagenten 2 und 3 (Textnetze);f) Network Agents 2 and 3 (text networks);
  • g) Werkzeug „Graphik” zur Konstruktion der visuellen Darstellung;g) Tool "Graphics" for construction the visual representation;
  • h) Werkzeug „Übersetzung” zur Konstruktion eines sprachlichen Textes.h) tool "translation" for construction a linguistic text.

Da das System zusätzlich zur Suchliste des Benutzers durch einen weiteren Suchagenten (Suchagent 2) noch eine zweite Liste von Begriffen erstellt, die im Text enthalten sind, kann der Benutzer entscheiden, ob er sein ursprüngliches Benutzernetz durch neue Begriffe aus dieser zweiten Liste erweitern will. Dies kann manuell oder auch automatisch erfolgen. Im ersten Fall gibt der Benutzer an, welche zusätzlichen Begriffe aus der zweiten Liste in die bisherigen Netzagenten eingefügt werden sollen. Daraus entstehen nach dem gleichen Verfahren, wie oben beschrieben, zwei weitere Netzagenten 3 und 4. Im zweiten Fall sucht das System nach bestimmten Kriterien, nämlich orientiert an Häufigkeiten wie beim Ranking-Verfahren, zusätzliche Begriffe aus der zweiten Liste heraus und konstruiert zwei weitere Netzagenten 5 und 6. In beiden Fällen bestehen also die neuen Netzagenten aus den bisherigen Netzagenten 2 und 3 sowie den entweder manuell eingegebenen oder automatisch selektierten zusätzlichen Begriffen. Falls gewünscht, kann der Benutzer auch beide Optionen nacheinander ausführen lassen.There the system in addition to the user's search list by another search agent (search agent 2) creates a second list of terms that are contained in the text the user can decide if he is his original Extend the user network with new terms from this second list want. This can be done manually or automatically. In the first Case, the user indicates which additional terms from the second List should be inserted in the previous network agents. Resulting from it by the same method as described above, two more Network agents 3 and 4. In the second case, the system searches for specific ones Criteria, namely oriented to frequencies as in the ranking process, additional Terms out of the second list and constructs two more network agents 5 and 6. In both cases Thus, the new network agents consist of the previous network agents 2 and 3 as well as either manually entered or automatically selected additional terms. If desired, The user can also execute both options one after the other.

Es erfolgt somit seitens des Benutzers nicht etwa ein Eingriff während des Verfahrens, sondern vielmehr ist das Verfahren insbesondere iterativ anwendbar, wobei selbstverständlich die zuvor generierten Analyseergebnisse als Eingangsgrößen eines weiteren Verfahrensdurchlaufes dienen können.It Thus, the user does not perform an intervention during the procedure The method is rather iterative applicable, of course the previously generated analysis results as input variables of another Process can serve.

Je nach gewählter Option wird wieder eine Aktivierung der Netzagenten vorgenommen und das Ergebnis dem Benutzer als die Bedeutung der gesamten Begriffe ausgegeben. Die Ausgabe an den Benutzer geschieht mit den gleichen Werkzeugen wie bereits beschrieben. Mit diesen Erweiterungsprozeduren kann der Benutzer jetzt wieder fortfahren oder die Analyse des Textes abbrechen. Dies Erweiterungskonzept basiert auf der Erfahrung, dass zu Beginn einer Suche häufig nur wenige Begriffe verfügbar sind und dass schon Zwischenergebnisse der Suche den Benutzer darauf bringen können, seine Suchbegriffe durch die vom Programm zusätzlich gefundenen zu erweitern. Wenn der Benutzer die Textanalyse abbricht, werden die Ergebnisse gespeichert und das Programm beginnt nach dem gleichen Verfahren mit der Interpretation des zweiten Textes in der Rankingliste.Depending on the selected option, the network agents are activated again and the result is output to the user as the meaning of the entire terms. The output to the user happens with the same tools as already described. With these extension procedures, the user can now proceed again or abort the analysis of the text. This Erwei concept is based on the experience that at the beginning of a search often only a few terms are available and that even intermediate results of the search can bring the user to expand his search terms by those additionally found by the program. When the user aborts the text analysis, the results are saved and the program starts the same process with the interpretation of the second text in the ranking list.

Um zu gewährleisten, dass das Verfahren und System bei der Erstellung der zweiten Liste nur Begriffe aufnimmt, die für den Text relevant sind, sind etablierte „Negativlisten” im Programm enthalten. Diese enthalten Wörter der Umgangssprache, die bei der Konstruktion der zweiten Liste nicht berücksichtigt werden sollen. Diese Negativlisten sind Standard und konnten dem System einfach hinzugefügt werden. Der wesentliche Vorteil besteht nun darin, dass der Benutzer selbst diese Negativlisten erweitern kann.Around to ensure, that the procedure and system in the creation of the second list only takes up concepts that are for the text are relevant, are established "negative lists" in the program contain. These contain words the colloquial language that does not in the construction of the second list considered should be. These blacklists are standard and could be the System just added become. The main advantage is that the user even expand these negative lists.

Auch die eben dargestellten zusätzlichen Komponenten werden noch einmal aufgelistet.Also the additional components just shown will be listed again.

Komponentenliste 2:Component List 2:

  • i) Suchagent 2 zur Erstellung einer erweiterten Liste;i) search agent 2 for creating an extended list;
  • j) Datei „Negativliste”;j) file "negative list";
  • k) Datei Liste 2;k) file list 2;
  • l) Werkzeug „Option” für manuelle und/oder automatische Erweiterung der Netzagenten;l) Tool "Option" for manual and / or automatic expansion of the network agents;
  • m–p) Netzagenten 3. 4. 5 und 6;m-p) Network agents 3. 4. 5 and 6;
  • q) Datei „Ergebnisse” des ersten Textes.q) Results file of the first one Text.

Falls der Benutzer nach einer einmaligen Erweiterung der Netzagenten 1 und 2 mit den gleichen Prozeduren fort fährt, entstehen zusätzliche Komponenten, die jedoch im Einzelnen nicht mehr aufgeführt werden. Hinsichtlich einer schematischen Übersicht zu sämtlichen Komponenten siehe 1.If the user continues with the same procedures after a single extension of the network agents 1 and 2, additional components are created, but these are not listed in detail. For a schematic overview of all components see 1 ,

Das prinzipiell Neue und besonders vorteilhafte an diesem Verfahren und System besteht insbesondere in folgenden Aspekten:

  • a) Die Bedeutung von Begriffen aus der Sicht des Benutzers einerseits und für einen bestimmten Text andererseits wird jeweils als Ergebnis eines dynamischen Netzprozesses aufgefasst. Die Konstruktion der jeweiligen Netze wird durch eine neuartige Lernregel geleistet. Damit folgt die Grundlogik des Verfahrens im Wesentlichen den Prozessen, die im menschlichen Gehirn ablaufen. Derartige Überlegungen für die Konstruktion von Meta-Suchmaschinen sind bisher noch nicht realisiert worden.
  • b) Das Programm kann insbesondere in dem Sinne streng am Benutzer orientiert sein, dass er nicht nur die anfänglichen Vorgaben eingibt. Insbesondere kann die Basis für den gesamten Ablauf des Programms die Sicht des Benutzers sein und nicht so sehr die Orientierung an einer objektiven Textstruktur – diese wird allerdings auch verwendet. Der Benutzer kann insbesondere die Netzerweiterung wieder durch seine eigene Sicht beeinflussen, was für ihn relevant ist oder nicht. Das Verfahren präsentiert dann auch die erweiterten Ergebnisse in Relation zur Sicht des Benutzers.
The principle new and particularly advantageous in this method and system consists in particular in the following aspects:
  • a) The meaning of terms from the point of view of the user on the one hand and for a particular text on the other hand is understood in each case as the result of a dynamic network process. The construction of the respective networks is done by a novel learning rule. Thus, the basic logic of the procedure essentially follows the processes that take place in the human brain. Such considerations for the construction of meta-search engines have not yet been realized.
  • b) The program may be strictly user-oriented, in particular in the sense that it not only inputs the initial specifications. In particular, the basis for the entire course of the program may be the user's view and not so much the orientation on an objective text structure - this is however also used. In particular, the user can influence the network extension again by his own point of view, which is relevant for him or not. The method then also presents the extended results in relation to the user's view.

Hilfe-Funktionen für die ProgrammnutzungHelp functions for program usage

Zur Unterstützung der Programmbenutzer wurden drei grundlegende Hilfe-Systeme entwickelt.

  • • Innerhalb des Programms wurden statische Hilfetexte auf jedem Programmfenster eingefügt, die den Benutzer durch die einzelnen Programmschritte leiten.
  • • Als Nachschlagewerk dient eine implementierte „Online-Hilfe”, in der, nach Stichpunkten geordnet, alle wesentlichen Bestandteile des Programms erklärt werden.
  • • Zum schnellen Einstieg in die Bedienung des Programms dient ein Video-Tutorial, bei dem permanent die Programmoberfläche sichtbar ist und über gesprochene Erläuterungen alle Programmschritte in Lektionen unterteilt durchgearbeitet werden.
To assist program users, three basic help systems have been developed.
  • • Within the program, static help texts have been added to each program window, guiding the user through the individual program steps.
  • • The reference work is an implemented "Online Help", in which, arranged by bullet points, all essential components of the program are explained.
  • • For quick access to the program, a video tutorial is used, in which the program interface is permanently visible and through spoken explanations all program steps are subdivided into lessons.

Der Benutzer wird also auditiv und visuell angesprochen, wodurch unterschiedliche Bereiche des Gehirns aktiviert werden und ein größerer Lernerfolg möglich ist. Durch diese drei Systeme wird ein Benutzer optimal und kontinuierlich bei der Verwendung des Programms unterstützt. Grundsätzlich wurde bei der Entwicklung zudem auf eine intuitive Bedienbarkeit geachtet.Of the The user is therefore audibly and visually addressed, resulting in different Areas of the brain are activated and greater learning success is possible. These three systems make a user optimal and continuous supported when using the program. Basically, in the development also paid attention to intuitive usability.

Vorteile auf einen BlickThe advantages at a glance

  • • Für den Anfänger auf einem Gebiet: Das Erweiterungskonzept basiert auf der Erfahrung, dass zu Begin einer Suche häufig nur wenige Begriffe verfügbar sind und dass schon Zwischenergebnisse der Suche den Benutzer darauf bringen können, seine Suchbegriffe durch die vom Programm zusätzlich gefundenen zu erweitern. Somit erhält der Benutzer Synonyme bzw. zusätzliche Begriffe, die eine Recherche effektivieren.• For the beginner up One area: The extension concept is based on the experience that at the beginning of a search frequently only a few terms available are and that intermediate results already search the user for it can bring his Expand search terms by those additionally found by the program. Thus receives the user synonyms or additional Terms that make a search more effective.
  • • Für den Experten: Durch die strukturierte und erweiterte Suche kann der Benutzer nach spezialisierten Informationen suchen.• For the expert: Due to the structured and advanced search, the user can post looking for specialized information.
  • • Der Benutzer kann selbst die Negativlisten erweitern, um unerwünschte Suchergebnisse (z. B. Werbung, Seminar- oder Vorlesungsankündigungen) zu umgehen.• Of the User can even extend the negative lists to unwanted search results (eg advertising, seminar or lecture announcements).
  • • Die Zusammenhänge zwischen den Begriffen in einem Text können graphisch betrachtet werden.• The relationships between the terms in a text can be viewed graphically.
  • • Zeitersparnis durch eine effektive und Benutzer orientierte Recherche.• Time savings through effective and user oriented research.

Primäre Einsatzgebieteprimary applications

  • • Für alle, die den neuesten Stand in der Forschung und Technik verfolgen müssen.• For all, who must follow the latest developments in research and technology.
  • • Das Programm kann als eine neue Form des E-Learning verwendet werden. Je nach Wissensstand können die Informationen über verschiedene Texte zugänglich gemacht werden.• The Program can be used as a new form of e-learning. Depending on the level of knowledge can the information about various texts accessible be made.

Claims (15)

Such- und Auswerteverfahren zur Auswertung von elektronisch gespeicherten Texten mittels eines Computersystems und neuronaler Netze unter Verwendung von vorgebbaren oder zuvor ermittelten Suchbegriffen, wobei ein jedes Neuron eine Aktivierung aufweist und über eine gewichtete Verbindung mit zumindest einem anderen Neuron verbunden ist, wobei das Produkt aus der Aktivierung des Neurons mit dem Verbindungsgewicht eine Endaktivierung bildet, dadurch gekennzeichnet, dass mehrere Suchbegriffe vorgegeben werden und zumindest zwei neuronale Netze generiert werden, wobei jeder Suchbegriff jeweils einem Neuron eines jeden Netzes zugeordnet wird, wobei bei dem ersten neuronalen Netz die Verbindungsgewichte konstant sind und die Aktivierung eines jeden Neurons in Abhängigkeit der Häufigkeit des Suchbegriffes im auszuwertenden Text erfolgt, und wobei bei dem zweiten neuronalen Netz die Verbindungsgewichte in Abhängigkeit der Häufigkeit des Suchbegriffes im auszuwertenden Text sind und die Aktivierung konstant ist, und eine Berechnung der jeweiligen Endaktivierungen beider Netze erfolgt.Search and evaluation method for the evaluation of electronically stored texts by means of a computer system and neural networks using predefinable or previously determined search terms, wherein each neuron has an activation and is connected via a weighted connection with at least one other neuron, wherein the product of the Activating the neuron with the connection weight forms an end activation, characterized in that a plurality of search terms are given and at least two neural networks are generated, each search term is assigned to each neuron of each network, wherein in the first neural network, the connection weights are constant and the Activation of each neuron takes place as a function of the frequency of the search term in the text to be evaluated, and wherein, in the case of the second neural network, the connection weights are dependent on the frequency of the search term in the text to be evaluated; tivation is constant, and a calculation of the respective end activations of both networks takes place. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass für jeden Suchbegriff der arithmetische Mittelwert aus beiden Endaktivierungen ermittelt wird.Method according to claim 1, characterized in that that for each search term is the arithmetic mean of both end activations is determined. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass eine Sortierung der Suchbegriffe nach absteigender Endaktivierung durchgeführt wird.Method according to claim 1 or 2, characterized that sort the search terms by decreasing final activation is carried out. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass es sich bei den Suchbegriffen um mittels einer vorhergehenden Suche unter Verwendung eines ersten Suchbegriffes ermittelten korrespondierende weitere Begriffe handelt.Method according to one of the preceding claims, characterized characterized in that the search terms by means of a previous search using a first search term determined corresponding additional terms. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass nach der Auswertung von mehreren Texten eine Rangliste der Texte nach Relevanz gebildet wird, wobei die Relevanz aus der Endaktivierung eines oder beider neuronaler Netze und/oder aus einem Mittelwert der Endaktivierungen beider neuronaler Netze abgeleitet wird.Method according to one of the preceding claims, characterized characterized in that after the evaluation of multiple texts one Ranking of texts is formed by relevance, with relevance the end activation of one or both neural networks and / or out derived from an average of the end activations of both neural networks becomes. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass mittels einer vorgebbaren Negativliste bestimmte Begriffe von einer Suche und/oder Auswertung ausnehmbar sind.Method according to one of the preceding claims, characterized characterized in that by means of a predetermined negative list certain Terms from a search and / or evaluation are excitable. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass mittels einer ersten Anwendung des Verfahrens korrespondierende Suchbegriffe zur Erweiterung der Suche ermittelt werden, mittels derer unter erneuter Anwendung des Verfahrens iterativ eines oder mehrere weitere Paare von neuronalen Netzen erzeugt und deren Endaktivierungen ermittelt werden.Method according to one of the preceding claims, characterized characterized in that by means of a first application of the method corresponding search terms are found to expand the search, by means of which, using the method again iteratively one or several other pairs of neural networks and their generated Final activations are determined. Such- und Auswertesystem zur Auswertung von elektronisch gespeicherten Texten, insbesondere zur Anwendung eines Verfahrens nach einem der vorherigen Ansprüche, aufweisend eine Benutzerschnittstelle zum Erhalt von Suchbegriffen, sowie eine Suchmaschinenschnittstelle zur Veranlassung einer Suche unter Verwendung der Suchbegriffe und zum Erhalt des Resultates der Suche und der aufgefundenen Texte, dadurch gekennzeichnet, dass das System einen Netzgenerators aufweist, mittels dessen zumindest zwei neuronale Netze generiert werden, wobei ein jedes Neuron eine Aktivierung aufweist und über eine gewichtete Verbindung mit zumindest einem anderen Neuron verbunden ist, wobei das Produkt aus der Aktivierung des Neurons mit dem Verbindungsgewicht eine Endaktivierung bildet, wobei jeder Suchbegriff jeweils einem Neuron eines jeden Netzes zugeordnet wird, und wobei eine Textauswerteeinheit vorgesehen ist, mittels derer die absoluten und/oder relativen Häufigkeiten der Suchbegriffe in einem Text ermittelt und an den Netzgenerator übergeben werden, wobei mittels des Netzgenerators bei dem ersten neuronalen Netz die Aktivierung eines jeden Neurons in Abhängigkeit der Häufigkeit des zugeordneten Suchbegriffes bei konstanten Verbindungsgewichten und bei dem zweiten neuronalen Netz die Verbindungsgewichte in Abhängigkeit der Häufigkeit des zugeordneten Suchbegriffes bei konstanter Aktivierung durchgeführt wird und die jeweiligen Endaktivierungen ermittelt werden, und aufweisend eine Ausgabeeinheit, mittels derer die Endaktivierungen der neuronalen Netze ausgegeben werden.Search and evaluation system for the evaluation of electronic stored texts, in particular for the application of a method according to one of the preceding claims, having a user interface for obtaining search terms, and a search engine interface for initiating a search using the search terms and to get the result the search and the found texts, characterized in that the system comprises a network generator, by means of which at least two neural networks are generated, with each neuron one Activation and over a weighted connection associated with at least one other neuron is, where the product of the activation of the neuron with the compound weight forms an end activation, each search term corresponding to one Neuron is assigned to each network, and wherein a text evaluation unit is provided by means of which the absolute and / or relative frequencies The search terms are determined in a text and passed to the network generator be, by means of the network generator at the first neural Net the activation of each neuron depending on the frequency of the assigned search term at constant connection weights and in the second neural network, the connection weights in dependence the frequency the associated search term is carried out at constant activation and determining the respective end activations, and having an output unit, by means of which the end activations of the neural Networks are output. System nach Anspruch 8, dadurch gekennzeichnet, dass es eine graphische Benutzerschnittstelle aufweist, mittels derer die Endaktivierungen der beiden neuronalen Netze in Bezug auf die verwendeten Suchbegriffe graphisch dargestellt werden.System according to claim 8, characterized in that it has a graphical user interface by means of which the end activations of the two neural networks in relation to the used search terms are graphically displayed. System nach Anspruch 8 oder 9, dadurch gekennzeichnet, es eine Benutzerschnittstelle aufweist, mittels derer eine Erläuterung in einer natürlichen Sprache über die Relevanz der Suchbegriffe in Bezug auf den ausgewerteten Text ausgegeben wird, wobei die Erläuterung mittels der Textauswerteeinheit aus den Endaktivierungen der beiden neuronalen Netze in Bezug auf die verwendeten Suchbegriffe generiert und.System according to claim 8 or 9, characterized in that it comprises a user interface by means of which an explanation in natural language about the relevance of the search terms in relation to the evaluated text is output, wherein the explanation by means of the text evaluation unit generated from the end activations of the two neural networks with respect to the search terms used and. System nach einem der Ansprüche 8 bis 10, dadurch gekennzeichnet, dass mittels der Ausgabeeinheit eine Rangliste einer Mehrzahl von ausgewerteten Texten gebildet und ausgegeben wird, wobei die Rangliste sich nach der Relevanz der Texte in Bezug auf die Suchbegriffe richtet.System according to one of claims 8 to 10, characterized in that by means of the output unit a ranking list of a plurality of Evaluated texts are formed and output, with the rankings depending on the relevance of the texts in relation to the search terms. System nach einem der Ansprüche 8 bis 11, dadurch gekennzeichnet, dass das System Datenspeicherungsmittel zur Abspeicherung und/oder Zwischenspeicherung der Suchbegriffe und/oder der aufgefundenen und/oder ausgewerteten Texte und/oder der neuronalen Netze sowie Netzparameter und/oder von Ranglisten aufweist.System according to one of claims 8 to 11, characterized that the system data storage means for storing and / or Caching of search terms and / or the found and / or evaluated texts and / or neural networks as well Network parameters and / or rankings. System nach einem der Ansprüche 8 bis 12, dadurch gekennzeichnet, dass eine Schnittstelle zum Erhalt von durch eine vorhergehende Suche ermittelten zu den ersten Suchbegriffen korrespondierenden weiteren Begriffen vorgesehen ist, wobei unter Verwendung der weiteren Begriffe das erste und zweite gebildete neuronale Netz erweitert und/oder ein drittes und viertes neuronales Netz mittels dem Netzgenerator gebildet wird.System according to one of claims 8 to 12, characterized that an interface to receive from a previous one Search determined further corresponding to the first search terms Conceived is provided, wherein using the other terms the first and second formed neural networks are expanded and / or expanded a third and fourth neural network by means of the network generator is formed. System nach einem der Ansprüche 8 bis 13, dadurch gekennzeichnet, dass ein Filter vorgesehen ist, mittels dessen eine vorgebbare Negativliste von Begriffen von einer Suche und/oder Auswertung ausnehmbar ist.System according to one of claims 8 to 13, characterized a filter is provided by means of which a prescribable negative list of terms of a search and / or evaluation is removable. Computerprogrammprodukt umfassend ein auf einem Computer lauffähiges Computerprogramm, welches das Verfahren nach einem der Ansprüche 1 bis 7 durchführt, wenn es auf einem Computer ausgeführt wird.Computer program product comprising one on one Computer running Computer program comprising the method according to one of claims 1 to 7 performs if it is running on a computer.
DE102008030125A 2008-06-27 2008-06-27 Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks Ceased DE102008030125A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102008030125A DE102008030125A1 (en) 2008-06-27 2008-06-27 Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102008030125A DE102008030125A1 (en) 2008-06-27 2008-06-27 Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks

Publications (1)

Publication Number Publication Date
DE102008030125A1 true DE102008030125A1 (en) 2010-01-14

Family

ID=41412495

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008030125A Ceased DE102008030125A1 (en) 2008-06-27 2008-06-27 Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks

Country Status (1)

Country Link
DE (1) DE102008030125A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070192863A1 (en) * 2005-07-01 2007-08-16 Harsh Kapoor Systems and methods for processing data flows
US20080112620A1 (en) * 2006-10-26 2008-05-15 Hubin Jiang Automated system for understanding document content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070192863A1 (en) * 2005-07-01 2007-08-16 Harsh Kapoor Systems and methods for processing data flows
US20080112620A1 (en) * 2006-10-26 2008-05-15 Hubin Jiang Automated system for understanding document content

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A. Schmidt: "A Modular Neural Network Architecture with Additional Generalization Abilities for High Dimensional Input Vectors", Manchester Metropolitan University, 1996, Department of Computing, S. i-x, 1-113 *
KOOTHS,S.: Management Support und Business Intelligence. In: MICE 2004, S.1-58 & Bib. www.kooths.de/mice/download/mice_pr- kooths_OPC-MSS-Muenster2004_de.pdf *
KOOTHS,S.: Management Support und Business Intelligence. In: MICE 2004, S.1-58 & Bib. www.kooths.de/mice/download/mice_pr- kooths_OPC-MSS-Muenster2004_de.pdf A. Schmidt: "A Modular Neural Network Architecture with Additional Generalization Abilities for High Dimensional Input Vectors", Manchester Metropolitan University, 1996, Department of Computing, S. i-x, 1-113

Similar Documents

Publication Publication Date Title
DE19952769B4 (en) Search engine and method for retrieving information using natural language queries
DE602004003361T2 (en) SYSTEM AND METHOD FOR GENERATING REFINEMENT CATEGORIES FOR A GROUP OF SEARCH RESULTS
DE19922974A1 (en) Method and device for processing a document
DE102006040208A1 (en) Patent-related search procedure and system
DE10034694A1 (en) Procedure for comparing search profiles
WO2010078859A1 (en) Method and system for detecting a similarity of documents
DE102008030125A1 (en) Electronically stored text evaluating and searching method, involves assigning search words to neuron such that combining weights depends in frequency of search word in text with neuronal network, and calculating end activation of networks
EP1064606B1 (en) Data processing system and method for the automatic creation of a summary of text documents
EP1412875B1 (en) Method for processing text in a computer and computer
EP2193457A1 (en) Detecting correlations between data representing information
EP1285385B1 (en) Method for finding objects
EP1754171A1 (en) Method and system for the automated generation of computer-based control and analysis devices
EP1170678B1 (en) Method and apparatus for automatically searching for relevant sets of images
DE10033548A1 (en) Procedure for previewing websites and computer program therefor
DE102014201540A1 (en) Method and device for analyzing texts
DE102016217191A1 (en) Method for selecting and evaluating a plurality of data records from at least one data source
DE10132591B4 (en) Method for supporting learning processes in computerized information systems
WO2022058194A1 (en) Method for generating a graphical summary, a computer program and a system
DE102019212477A1 (en) Computer-implemented method for training a model, method for control, assistance and classification system
DE10291392B4 (en) Method, system and data carrier for generating correlations and / or interactions and / or knowledge from a plurality of searched data sets
Wolbring Why the attempt to separate productivity and discrimination effects on students’ evaluations of teaching fails: Selective samples, missing mediator variables and confounding of effects
EP3531300A1 (en) Computer-implemented method for acquiring information
DE112019006203T5 (en) Method for classifying content and method for generating a classification model
DE102014219383A1 (en) Method for the computer-aided processing of digital documents
WO2010078858A1 (en) Detection of a similarity of documents by citation analysis

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R006 Appeal filed
R008 Case pending at federal patent court
R003 Refusal decision now final
R003 Refusal decision now final
R011 All appeals rejected, refused or otherwise settled