Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020108748 - SYSTÈME ET PROCÉDÉ POUR LA DÉCOUVERTE DE COMBINAISONS OPTIMISÉES DE FONCTIONS DE CALCUL

Note: Texte fondé sur des processus automatiques de reconnaissance optique de caractères. Seule la version PDF a une valeur juridique

[ DE ]

Patentansprüche

1. Ein System (100) zum Auffinden einer oder mehrerer opti mierter Kombination (en) von Berechnungsfunktionen (fl, f2, ..., fN) zur Berechnung von Merkmalen (ml, m2, ..., mN) einer Enti tät, umfassend einen Lernverstärkungs-Agenten (200), der dazu ausgebildet ist, eine oder mehrere Kombination von Berech nungsfunktionen (fl, f2, ..., fN) auszuwählen, welche an ein Datenvorverarbeitungsmodul (300) weitergegeben werden, wobei das Datenvorverarbeitungsmodul (300) ausgebildet ist, aus den Daten eines Trainingsdatensatzes (320) mittels der ausgewähl ten Berechnungsfunktionen (fl, f2, ..., fN) die Merkmale (ml, m2, ...,mN) zu berechnen und die Merkmale (ml, m2, ..., mN) an ein Maschinenlernmodul (400) weiterzugeben, welches dazu aus gebildet ist, die Merkmale (ml, m2, ..., mN) zu analysieren und/oder zu trainieren und das Lernergebnis an ein Bewer tungsmodul (440) weiterzugeben, das ausgebildet ist, eine Be wertung für das Lernergebnis zu erstellen und diese Bewertung an den Lernverstärkungs-Agenten (200) weiterzugeben, der aus gebildet ist auf Basis dieser Bewertung des Lernergebnisses erneut eine oder mehrere Kombination (en) von Berechnungsfunk tionen (fl, f2, ..., fN) auszuwählen.

2. Das System (100) nach Anspruch 1, dadurch gekennzeich net, dass das Bewertungsmodul (440) ausgebildet ist, die Be wertung für das Lernergebnis an ein Belohnungsmodul (500) weiterzugeben, das ausgebildet ist, die Bewertung durch eine Verstärkungsfunktion zu verstärken und/oder eine Belohnung zu erzeugen und die Bewertung und/oder Belohnung an den Lernver stärkungs-Agenten (200) weiterzugeben.

3. Das System (100) nach Anspruch 1 oder 2, dadurch gekenn zeichnet, dass der Lernverstärkungs-Agent (200) eine Daten bank (220) für die Bewertung von Zustands-Aktions-Paaren (s|a) bezogen auf die Auswahl von Aktionen (al, a2, ..., aN) für Zustände (sl, s2, ..., sN) einer Entität aufweist.

4. Das System (100) nach Anspruch 3, dadurch gekennzeich net, dass die Datenbank (220) als Qualitäts-Matrix ausgebil det ist für die Bewertung der Zustands-Aktions-Paare (s|a).

5. Das System (100) nach Anspruch 3, dadurch gekennzeich net, dass die Datenbank (220) als neuronales Netz ausgebildet ist und/oder durch Regeln erweiterbar ist.

6. Das System (100) nach einem oder mehreren der vorange henden Ansprüche, dadurch gekennzeichnet, dass das Maschinen lernmodul (400) ausgebildet ist, einen Algorithmus (420) aus dem überwachten Lernen und/oder dem unüberwachten Lernen und/oder dem verstärkenden Lernen zu verwenden.

7. Das System (100) nach einem oder mehreren der vorange henden Ansprüche 1 bis 6, dadurch gekennzeichnet, dass ein Trainingsmodus und ein Laufzeitmodus vorgesehen sind, wobei der Wechsel von dem Trainingsmodus in den Laufzeitmodus und/oder der Wechsel von dem Laufzeitmodus in den Trainings modus automatisch durchführbar ist.

8. Das System (100) nach einem oder mehreren der vorange henden Ansprüche 1 bis 7, dadurch gekennzeichnet, dass der Lernverstärkungsagent (200) ausgebildet ist, einen Initiali sierungsschritt durchzuführen zur Vorauswahl von Kombinatio nen von Aktionen (al, a2, ..., aN) ) .

9. Das System (100) nach einem oder mehreren der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass der Lernverstärkungs-Agent (200) ausgebildet ist, die Auswahl der Berechnungsfunk tionen (fl, f2, ..., fN) in Abhängigkeit von Optimierungskrite rien wie der Auslastung und/oder der Rechengeschwindigkeit eines Endgerätes durchzuführen.

10. Ein Verfahren zum Auffinden von einer oder mehreren op timierten Kombination (en) von Berechnungsfunktionen (fl, f2, ..., fN) zur Berechnung von Merkmalen (ma, m2, ..., mN) einer En- tität unter Verwendung eines Lernverstärkungsagenten (200), umfassend :

(a) Auswahlen (S10) von einer oder mehreren Kombinati on (en) von Berechnungsfunktionen (fl, f2, ..., fN) von dem Lernverstärkungsagenten (200);

(b) Weitergeben (S20) der ausgewählten Berechnungsfunk tionen (fl, f2, ..., fN) von dem Lernverstärkungs agenten (200) an ein Datenvorverarbeitungsmodul (300) ;

(c) Berechnen (S30) von Merkmalen (ml, m2, ..., mN) aus den Daten eines Trainingsdatensatzes (320) mittels der ausgewählten Berechnungsfunktionen (fl, f2, ..., fN) in dem Datenvorverarbeitungsmodul (300);

(d) Weitergeben (S40) der Merkmale (ml, m2, ..., mN) von dem Datenvorverarbeitungsmodul an ein Maschinen lernmodul (400);

(e) Analysieren und/oder Trainieren (S50) der Merkmale (ml, m2, ..., mN) in dem Maschinenlernmodul (400);

(f) Weitergeben (S60) des Lernergebnisses des Maschi nenlernmoduls (400) an ein Bewertungsmodul (440);

(g) Erstellen (S70) einer Bewertung des Lernergebnisses in dem Bewertungsmodul (440);

(h) Weitergeben (S80) der Bewertung des Lernergebnisses an den Lernverstärkungs-Agenten (200);

(i) Auswählen (S90) von einer oder mehreren Kombinati on (en) von Berechnungsfunktionen (fl, f2, ..., fN) von dem Lernverstärkungsagenten (200) auf Basis der Bewertung des Lernergebnisses.

11. Das Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass die Schritte S10 - S90 solange wiederholt werden, bis eine optimierte Kombination der Berechnungsfunktionen (fl, f2, ..., fN) gefunden wurde.

12. Das Verfahren nach Anspruch 10 oder 11, dadurch gekenn zeichnet, dass das Bewertungsmodul (440) die Bewertung an ein Belohnungsmodul (500) weitergibt, welches die Bewertung durch eine Verstärkungsfunktion verstärkt und/oder eine Belohnung erzeugt und die Bewertung und/oder Belohnung an den LV-Agenten (200) weitergibt.

13. Das Verfahren nach einem oder mehreren der Ansprüche 10 bis 12, dadurch gekennzeichnet, dass der Lernverstärkungs-Agent (200) eine Datenbank (220) für die Bewertung von Zu-stands-Aktions-Paaren (s|a) bezogen auf die Auswahl von Akti onen (al, a2, ..., aN) für Zustände (sl, s2, ..., sN) einer Enti-tät verwendet.

14. Das Verfahren nach einem oder mehreren der Ansprüche 10 bis 13, dadurch gekennzeichnet, dass die Datenbank (220) als Qualitäts-Matrix für die Bewertung der Zustands-Aktions-Paare (s|a) und/oder als neuronales Netz ausgebildet ist und/oder durch Regeln erweiterbar ist.

15. Das Verfahren nach einem oder mehreren der vorangehenden Ansprüche 10 bis 14, dadurch gekennzeichnet, dass ein Trai-ningsmodus und ein Laufzeitmodus vorgesehen sind, wobei der Wechsel von dem Trainingsmodus in den Laufzeitmodus und der Wechsel von dem Laufzeitmodus in den Trainingsmodus automa tisch durchgeführt wird.