Translation of "Sprachliche äußerung" in English
Über
die
Benutzerschnittstelle
21
können
als
Antwort
des
Systems
20
auf
eine
empfangene
sprachliche
Äußerung
mittels
einer
Dialogsteuerung
23
generierter
Sprachsignale
am
Ausgang
23
an
einen
Benutzer
als
Antwort
auf
eine
Spracheingabe
ausgegeben
werden.
As
a
reply
of
the
system
20
to
a
received
speech
utterance,
speech
signals
at
the
output
23,
generated
by
means
of
a
dialogue
control
unit
23,
can
be
supplied
via
the
user
interface
21
to
a
user
as
a
reply
to
a
speech
input.
EuroPat v2
Die
Erfindung
betrifft
ein
Verfahren
zur
Adaption
von
linguistischen
Sprachmodellen
in
Systemen
mit
automatischer
Spracherkennung
mittels
während
des
Betriebs
der
Systeme
erhaltener
Spracherkennungsergebnisse,
wobei
während
der
Adaption
eine
Auswertung
einer
Liste
N
bester
Erkennungsergebnisalternativen
mit
N
>
1
für
eine
zu
erkennende
sprachliche
Äußerung
vorgesehen
ist.
FIELD
OF
THE
INVENTION
The
invention
relates
to
a
method
of
adapting
linguistic
speech
models
in
automatic
speech
recognition
systems
by
means
of
speech
recognition
results
obtained
during
operation
of
the
systems,
in
which,
during
the
adaptation,
a
list
of
N-best
recognition
result
alternatives
with
N>1
for
a
speech
utterance
to
be
recognized
is
evaluated.
EuroPat v2
Eine
solche
Adaption
wird
als
unüberwacht
bezeichnet,
da
dem
Spracherkenner
nur
das
ermittelte
Spracherkennungsergebnis,
nicht
aber
eine
gesicherte
Information
über
die
tatsächlich
abgegebene
sprachliche
Äußerung
zur
Verfügung
steht.
Such
an
adaptation
is
designated
as
being
unsupervised
because
only
the
speech
recognition
result
found
is
available
to
the
speech
recognizer,
rather
than
safe
information
about
the
actually
provided
speech
utterance.
EuroPat v2
Durch
die
Verarbeitungsschritte,
in
denen
der
Benutzer
zur
Bestätigung
oder
Ablehnung
von
erkannten
Buchstaben
aufgefordert
wird,
wird
dem
System
sukzessive
eine
Rückkopplung
bezüglich
der
Richtigkeit
des
bis
dahin
vorliegenden
Erkennungsergebnisses
bezogen
auf
die
zu
erkennende
sprachliche
Äußerung
gegeben.
By
means
of
the
processing
steps,
in
which
the
user
is
requested
to
acknowledge
or
reject
recognized
letters,
the
system
receives
a
feedback
relating
to
the
correctness
of
the
recognition
result
achieved
thus
far
relative
to
the
speech
utterance
to
be
recognized.
EuroPat v2
Als
weitere
Ausgestaltung
wird
vorgeschlagen,
daß
ungültige
und
fälschlicherweise
erkannte
Anfangsbuchstabenkombinationen
im
linguistischen
Sprachmodell
als
unzulässig
definiert
und
dem
Benutzer
nicht
vorgeschlagen
werden
und
daß
die
Spracherkennungseinheit
mittels
des
angepaßten
linguistischen
Sprachmodells
in
solch
einem
Fall
ein
weiteres
Erkennungsergebnis
für
die
sprachliche
Äußerung
ermittelt,
aus
dem
der
an
den
Benutzer
zur
Bestätigung
auszugebende
Buchstabe
bestimmt
wird.
As
a
further
embodiment
there
is
proposed
that
invalid
and
wrongly
recognized
initial
letter
combinations
in
the
linguistic
speech
model
are
defined
as
invalid
and
are
not
proposed
to
the
user
and
that
in
such
a
case
the
speech
recognition
unit
determines
a
further
recognition
result
for
the
speech
utterance
by
means
of
the
adapted
linguistic
speech
model,
from
which
result
is
determined
the
letter
to
be
supplied
to
the
user
for
him
to
acknowledge.
EuroPat v2
Dies
wird
im
folgenden
zur
Besserung
Illustration
anhand
einer
konkreten
eingegebenen
sprachliche
Äußerung,
der
Eingabe
des
Ortsnamens
"AACHEN",
näher
beschrieben.
This
will
be
further
described
in
the
following
as
a
better
illustration
with
the
aid
of
a
concrete
entered
speech
utterance,
the
entry
of
the
place
name
“AACHEN”.
EuroPat v2
Angenommen
sei
nun
beispielhaft,
die
Spracherkennungseinheit
2
befinde
sich
in
einem
Modus
zur
Eingabe
von
Ortsnamen
und
habe
im
ersten
Schritt
als
Erkennungsergebnis
"AADAEM"
für
die
eingegebene
sprachliche
Äußerung
"AACHEN"
ermittelt,
wobei
bei
den
Spracherkennungsprozeduren
eine
Netzwerkgrammatik
verwendet
wurde,
die
noch
keinerlei
Einschränkung
bezüglich
der
zu
erkennenden
Buchstaben
der
sprachlichen
Äußerung
enhält.
For
example,
there
is
assumed
that
the
speech
recognition
unit
2
is
in
a
mode
for
entering
place
names
and
has
in
the
first
step
determined
“AADAEM”
as
a
recognition
result
for
the
speech
utterance
“AACHEN”,
with
a
network
grammar
being
used
during
the
speech
recognition
procedures,
which
grammar
has
no
constraint
with
respect
to
the
speech
utterance
letters
to
be
recognized.
EuroPat v2
Einem
Funktionsblock
1
des
dargestellten
Spracherkennungssystems
wird
eine
Folge
EPMATHMARKEREP
von
Merkmalsvektoren
x
t
mit
der
Zeitvariablen
t
=
1,...,
T
zugeführt,
die
eine
sprachliche
Äußerung
-
insbesondere
ein
Einzelwort
-
repräsentieren.
A
sequence
X=x
1,
x
2,
.
.
.,
x
T
of
characteristic
vectors
x
t
with
the
time
variables
t=1,
.
.
.,
T
representing
a
speech
utterance,
particularly
a
single
word,
is
applied
to
a
function
block
1
of
the
speech
recognition
system
shown.
EuroPat v2
Eine
Möglichkeit
der
Weiterverarbeitung
besteht
darin,
das
linguistische
Modell
so
zu
modifizieren,
daß
die
zugehörige
Kante
zwischen
zwei
Knoten
entfernt
wird
und
mit
der
so
modifizierten
Netzwerkgrammatik
ein
erneuter
Spracherkennungsprozeß
mittels
der
Spracherkennungseinheit
2
für
die
gespeicherte
sprachliche
Äußerung
durchgeführt
wird.
One
possibility
of
further
processing
comprises
modifying
the
linguistic
model,
so
that
the
associated
edge
between
two
nodes
is
removed
and,
with
the
network
grammar
modified
thus,
a
new
recognition
process
is
carried
out
by
means
of
the
speech
recognition
unit
2
for
the
stored
speech
utterance.
EuroPat v2
Liefert
der
Spracherkenner
für
eine
eingegebene
sprachliche
Äußerung
jeweils
nur
eine
Wortfolgenhypothese,
und
lässt
sich
kein
Unternehmensname
finden,
der
vollständig
in
dieser
Wortfolgenhypothese
repräsentiert
ist,
so
wird
ein
Unternehmensname
selektiert
werden,
der
wenigstens
teilweise
in
der
Wortfolgenhypothese
enthalten
ist.
If
the
speech
recognizer
produces
only
one
word
sequence
hypothesis
for
each
speech
utterance
entered,
and
if
no
company
name
can
be
found
that
is
completely
represented
in
this
word
sequence
hypothesis,
a
company
name
will
be
selected
that
contains
at
least
partly
the
word
sequence
hypothesis.
EuroPat v2
Eine
sprachliche
Äußerung
eines
Benutzers
kann
so
über
das
Telefonendgerät
4,
dass
öffentliche
Telefonnetz
3
und
die
Schnittstelle
2
einer
Verarbeitungseinheit
5,
die
zur
Umsetzung
von
Sprache
in
Text
dient,
zugeführt
werden.
A
speech
utterance
of
a
user
can
thus
be
applied
via
the
telephone
terminal
4,
the
public
telephone
network
3
and
the
interface
2
to
a
processing
unit
5,
which
is
used
for
converting
speech
into
text.
EuroPat v2
Anderseits
besteht
auch
die
Möglichkeit,
daß
die
Spracherkennungseinheit
als
Erkennungsergebnis
eine
Liste
N
bester
Erkennungsalternativen
für
die
sprachliche
Äußerung
ermittelt
und
daß
nach
einer
Ablehnung
eines
erkannten
Buchstabens
durch
den
Benutzer
der
entsprechende
Buchstabe
der
zweitbesten
Lösungsalternative
an
den
Benutzer
ausgegeben
wird.
On
the
other
hand,
there
is
also
the
possibility
that
the
speech
recognition
unit
determines
a
list
N
of
best
recognition
alternatives
as
a
recognition
result
for
the
speech
utterance
and
that,
after
the
user
has
rejected
a
recognized
letter,
the
user
is
given
the
respective
letter
of
the
second-best
solution
alternative.
EuroPat v2
Wird
vorausgesetzt,
daß
die
eingegebene
sprachliche
Äußerung
nur
Wörter
einer
begrenzten
Wortmenge
enthält,
beispielsweise
bei
der
Eingabe
in
ein
Navigationssystem
für
Landkraftfahrzeuge
in
einem
bestimmten
Eingabemodus
nur
Ortsnamen,
kann
mittels
dieser
Erfindungsvariante
das
zugrundeliegende
linguistische
Sprachmodell
entsprechend
angepaßt
werden,
da
die
Menge
möglicher
Spracherkennungsergebnisse
bezüglich
der
eingegebenen
sprachlichen
Äußerung
tatsächlich
als
beschränkt
angenommen
werden
kann.
If
there
is
assumed
that
the
entered
speech
utterance
contains
only
words
from
a
limited
number
of
words,
for
example,
when
in
a
certain
entry
mode
only
place
names
are
entered
in
a
navigation
system
for
motor
vehicles,
by
means
of
this
variant
of
the
invention
the
basic
linguistic
speech
model
can
accordingly
be
adapted,
because
the
number
of
possible
speech
recognition
results
relating
to
the
entered
speech
utterance
may
really
be
considered
limited.
EuroPat v2
Ein
Funktionsblock
2
stellt
eine
Spracherkennungseinheit
("automatic
speech
recognizer",
ASR)
dar,
der
an
ihrem
Eingang
3
eine
in
Form
von
Merkmalsvektoren
vorliegende
buchstabierte
sprachliche
Äußerung
zugeführt
wird.
A
functional
block
2
represents
a
speech
recognition
unit
(automatic
speech
recognizer
ASR),
which
is
supplied
at
its
input
3
with
a
speech
utterance
available
in
the
form
of
feature
vectors.
EuroPat v2
Die
Spracherkennungseinheit
2
speichert
die
Merkmalsvektoren
für
die
weitere
Verarbeitung
ab
und
ermittelt
aus
diesen
ein
Erkennungsergebnis
für
die
eingegebene
gesamte
sprachliche
Äußerung.
The
speech
recognition
unit
2
stores
the
feature
vectors
for
the
further
processing
and
determines
therefrom
a
recognition
result
for
the
entered
total
speech
utterance.
EuroPat v2
Liefert
der
Spracherkenner
für
eine
sprachliche
Äußerung
mehrere
Wortfolgenhypothesen,
wird
der
Abgleich
mit
den
Datenbankeinträgen
entsprechend
erweitert
und
die
in
Anbetracht
der
in
der
Datenbank
gespeicherten
Unternehmensnamen
beste
Wortfolgenhypothese
ermittelt.
If
the
speech
recognizer
produces
various
word
sequence
hypotheses
for
a
speech
utterance,
the
comparison
with
the
database
entries
is
extended
accordingly
and
the
best
word
sequence
hypothesis
considering
the
company
names
stored
in
the
database
is
determined.
EuroPat v2
Vorzugsweise
liefert
der
Spracherkenner
10
für
eine
sprachliche
Äußerung
nicht
nur
eine
Wortfolgenhypothese,
sondern
mehrere
N
beste
Wortfolgenhypothesen
(N
>1).
Preferably,
the
speech
recognizer
10
produces
not
only
one
word
sequence
hypothesis,
but
a
plurality
of
N
best
word
sequence
hypotheses
(N>1)
for
a
speech
utterance.
EuroPat v2
Muss
jede
Form
einer
rassenbezogenen
sprachlichen
Äußerung,
die
jemanden
beleidigen
könnte,
verfolgt
werden?
Is
any
form
of
race-related
speech
that
anybody
finds
offensive
to
be
prosecuted?
News-Commentary v14
Die
Erfindung
betrifft
ein
Verfahren
zur
automatischen
Erkennung
einer
wenigstens
teilweise
buchstabierten
sprachlichen
Äußerung
mit
einer
auf
statistischen
Modellen
einschließlich
eines
linguistischen
Sprachmodells
(6)
basierenden
Spracherkennungseinheit
(2).
The
invention
relates
to
a
method
of
automatic
recognition
of
an
at
least
partly
spelled
speech
utterance,
with
a
speech
recognition
unit
(2)
based
on
statistical
models
that
include
a
linguistic
speech
model
(6).
EuroPat v2
Dies
hat
den
Vorteil,
daß
ein
Ausgleich
für
die
Fälle
geschaffen
wird,
in
denen
das
als
beste
Erkennungsergebnisalternative
bewertete
Element
der
Liste
N
bester
Erkennungsergebnisalternativen
nicht
der
tatsächlich
abgegebenen
sprachlichen
Äußerung
entspricht.
This
has
the
advantage
that
a
compensation
is
created
for
those
cases
where
the
element
of
the
list
of
N-best
recognition
result
alternatives
evaluated
as
the
best
recognition
result
alternative
does
not
correspond
to
the
actually
provided
speech
utterance.
EuroPat v2
Insbesondere
bei
der
Erkennung
von
Folgen
einzelner
Sprachelemente,
die
zu
einer
sprachlichen
Äußerung
zusammengefaßt
werden,
nutzt
die
Erfindung
den
Umstand
aus,
daß
einzelne
Sprachelemente
der
tatsächlich
abgegebenen
sprachlichen
Äußerung,
wenn
auch
nicht
in
der
besten
Erkennungsalternative,
so
doch
mit
hoher
Wahrscheinlichkeit
in
mindestens
einer
der
anderen
Listenelemente
der
Liste
N
bester
Erkennungsergebnisalternativen
repräsentiert
sind.
Particularly
when
recognizing
sequences
of
single
speech
elements,
which
are
combined
to
a
speech
utterance,
the
invention
benefits
from
the
fact
that
single
speech
elements
of
the
actual
speech
utterance
may
not
be
represented
in
the
best
recognition
alternative
but
with
great
probability
in
at
least
one
of
the
other
list
elements
of
the
list
of
N-best
recognition
result
alternatives.
EuroPat v2
Weiterhin
ist
in
Fällen,
bei
denen
in
der
besten
Erkennungsergebnisalternative
der
Liste
N
bester
Erkennungsergebnisalternativen
Sprachelemente
repräsentiert
sind,
die
nicht
Teil
der
tatsächlich
abgegebenen
sprachlichen
Äußerung
waren,
es
sehr
wahrscheinlich,
daß
solche
Sprachelemente
in
den
übrigen
Listenelementen
nicht
repräsentiert
sind.
Furthermore,
in
cases
where
speech
elements
are
represented
in
the
best
recognition
result
alternative
of
the
list
of
N-best
recognition
result
alternatives,
which
speech
elements
were
not
part
of
the
actual
speech
utterance,
it
is
very
probable
that
such
speech
elements
are
not
represented
in
the
other
list
elements.
EuroPat v2
Dies
kann
als
Information
im
linguistischen
Sprachmodell
so
umgesetzt
werden,
daß
bei
der
Ablehnung
eines
solchen
Buchstabens
durch
den
Benutzer
eine
im
Vergleich
zur
Wahrscheinlichkeit
anderer
Buchstaben
höhere
Wahrscheinlichkeit
dafür
angenommen
wird,
daß
ein
diesem
Buchstaben
als
akustisch
ähnlich
definierter
Buchstabe
der
richtige
und
tatsächlich
als
Teil
der
buchstabierten
sprachlichen
Äußerung
eingegebener
Buchstabe
ist.
This
may
be
converted
as
information
in
the
linguistic
speech
model
so
that,
in
case
the
user
rejects
such
a
letter,
a
higher
probability
than
the
probability
of
other
letters
is
assumed,
so
that
a
letter
defined
as
acoustically
similar
to
this
letter
is
the
correct
one
and
it
has
actually
been
entered
as
part
of
the
spelled
speech
utterance.
EuroPat v2
Das
in
der
Regel
noch
mit
Erkennungsfehlern
behaftete
erste
Erkennungsergebnis
zu
der
sprachlichen
Äußerung
wird
noch
nicht
an
den
Benutzer
ausgegeben,
sondern
es
folgt
eine
Ausgabe
einzelner
erkannter
Buchstaben
an
den
Benutzer
mit
der
Aufforderung,
diese
zu
bestätigen
oder
abzulehnen.
The
first
recognition
result
of
the
speech
utterance
generally
still
having
recognition
errors
is
not
yet
passed
on
to
the
user,
but
individual
recognized
letters
are
passed
on
to
the
user
with
the
request
to
acknowledge
or
reject
them.
EuroPat v2
Auch
dies
führt
zu
einer
beschleunigten
Erkennung
der
buchstabierten
sprachlichen
Äußerung
und
erhöht
der
Komfort
für
den
Benutzer.
This
too
leads
to
a
faster
recognition
of
the
spelled
speech
utterance
and
increases
the
convenience
to
the
user.
EuroPat v2
Insbesondere
kann
es
auch
ausreichen,
wenn
der
Benutzer
nur
einen
Teil
der
zu
erkennenden
sprachlichen
Äußerung
buchstabiert
und
als
akustisch
zu
modellierende
Buchstabenfolge
eingibt.
More
particularly,
it
may
also
be
sufficient
when
the
user
spells
only
part
of
the
speech
utterance
to
be
recognized
and
enters
it
as
a
letter
sequence
to
be
modeled
acoustically.
EuroPat v2