04. Januar 2024
Siri oder Alexa machen unseren Alltag seit einiger Zeit einfacher – aber eine echte, menschliche emotionale Verbindung zu ihnen fehlt immer noch. Nun betritt der technologische Fortschritt eine neue Bühne: Die Transformation von rein text- und audiobasierten Assistent:innen zu digitalen Charakteren, die uns erstaunlich menschenähnlich erscheinen. Die neueste Errungenschaft auf diesem Weg sind Digital Humans – KI-gestützte, visuelle Botschafter:innen, die darauf abzielen, menschliche Interaktionen in unendlichem Umfang nachzubilden. Digital Humans stellen eigenständige, virtuelle Persönlichkeiten dar, die in der Lage sind, eine tiefere Verbindung zu Menschen herzustellen als es bisher körperlose Chatbots vermochten. Es ist keine bloße Weiterentwicklung von Assistenzsystemen, sondern eine evolutionäre Stufe in der virtuellen Interaktion, der wir vermehrt begegnen werden.
Dieser Artikel gewährt einen umfassenden Einblick in das aufstrebende Phänomen der Digital Humans, von ihrer Entstehung bis zu den vielfältigen Facetten dieses Trends, die uns in Zukunft erwarten.
Digital Humans sind KI-betriebene, menschenähnliche virtuelle Wesen oder Charaktere, die in menschliche Interaktion treten, um ein emotionales, aber vor allem personalisiertes Serviceerlebnis zu schaffen. Sie sind ein humanoides, digitales Abbild, das die gesamte Bandbreite menschlicher Körpersprache, wie Bewegungen, Stimme und Mimik nachempfinden kann und durch Artificial Intelligence (AI) individuell auf Bedürfnisse und Emotionen des Gegenübers eingehen kann.
Menschenähnlich sind sie besonders im Erscheinungsbild. Es gibt heute bereits viele gute Umsetzungen, wo sie optisch kaum von realen Menschen zu unterscheiden sind. In der menschlichen Interaktion und im Verhalten sind sie Menschen ebenso ähnlich: Wir können mit ihnen sprechen, sie hören uns zu, sie können helfen, uns durch Prozesse führen, Ratschläge geben oder ein bestimmtes Problem lösen. Sie lachen uns an, sie zwinkern uns zu, sie können empathisch sein.
Letztlich können Digital Humans als eine Unterkategorie von Avataren verstanden werden. Ein digitaler Avatar kann als elektronisches Abbild definiert werden, das eine künstliche Person oder eine Grafikfigur darstellt und durch eine Benutzerin oder einen Benutzer verändert werden kann. Für Digital Humans gilt das auch, mit einer besonderen Ergänzung: Digitale Menschen sehen augenscheinlich wie Menschen aus. Während es abstrakte, künstlerisch angehauchte oder Karikatur-ähnliche Avatare in verschiedenen Stilen gibt, sind digitale Menschen kaum bzw. nicht von echten Menschen zu unterscheiden. Sie wirken lebensecht und werden darauf vorbereitet, Emotionen zu erkennen, zuzuhören und zuzusehen. Das passiert auf Basis vordefinierter und an die KI kommunizierter Erwartungen durch ihre Schöpfer:innen und kontinuierlichem Training – getrieben durch den rasanten technologischen Fortschritt bei Rechenleistung, Computergrafik, Computeranimation und KI.
Ein digitaler Mensch kann ein digitaler Zwilling einer realen Person (basierend auf ihren anatomischen, physischen und biologischen Merkmalen) oder eine fiktive Figur sein (zum Beispiel basierend auf dem Aussehen eines Schauspielers oder vollständig vom Computer generiert).
Dafür werden auch 3D Scans oder Modelle eingesetzt, die über die letzten Jahre immer fortschrittlicher geworden sind. Das Ganze, verbunden mit weiteren KI-Möglichkeiten, macht möglich, dass ein fotorealistischer Look und Bewegungen reproduziert werden können, um eine non-verbale Kommunikation sicherzustellen.
Interessant ist auch: Jeder Digital Human hat eine eigene DNA. Wenn man also unversiegelt mit dieser DNA arbeitet, zum Beispiel unternehmensübergreifend, fördert das die Begegnung unter Digital Humans, was wiederum neue Erkenntnisse durch Kooperation und Kollaboration liefert.
Der große Mehrwert von Digital Humans, beispielsweise im direkten Vergleich zu Chatbots, ist die Fähigkeit der non-verbalen Kommunikation. Klar ist, dass wir eher mit einer Person, die wir sehen können und die auf verschiedenen Ebenen auf mich und meine Bedürfnisse eingehen kann, mehr Relevanz schenken (können) als wir es einem Chatbot tun, von dem wir nicht wissen, ob wir mit einer Künstlichen Intelligenz (KI) oder einer realen Person kommunizieren.
Damit liefern gut realisierte Digital Humans nicht nur die gewünschten Informationen, sondern zusätzlich die passende non-verbale Kommunikation, die für die Interaktion selbst, aber auch ihre anschließende Bewertung außerordentlich wichtig ist. Denn wir kommunizieren nicht nur über das gesprochene Wort, sondern auch über unsere Körpersprache, unsere Mimik und Gestik. Und diese Art von Kommunikation unterschätzen wir oft – in unterschiedlichen Situationen und Momenten, meist auch unbewusst.
Durch ihre Existenz und Verbreitung sind Digital Humans in der Lage, unsere virtuellen Interaktionen zu humanisieren. Das hat enormen Einfluss auf die Interaktion: Denn, wenn sich die Kommunikation real anfühlt – auch wenn die Art und Weise, wie Menschen kommunizieren, nur kopiert ist und die Emotionen gespiegelt sind, bringt das einen echten Mehrwert.
Digital Humans verknüpfen Machine Learning – im Besonderen Conversational AI – Spracherkennung und natürliche Sprachverarbeitung, um einen emotionalen Berührungspunkt mit dem Gegenüber herzustellen. Die KI ermöglicht ihnen, zu verstehen, was wir sagen und mit uns in Interaktion zu treten. Durch die Verarbeitung natürlicher Sprache können sie Sprachbefehle verstehen, durch die Generierung natürlicher Sprache Antworten formulieren.
Das passiert auf Basis von Natural Language Processing (NLP) Algorithmen, die die geschriebenen oder gesprochenen Wörter verarbeiten und analysieren. Der Algorithmus des Digital Human lernt beispielsweise aus Gesichtsausdrücken, die die Webcam Aufzeichnungen der Nutzer:innen mit sich bringen. So lernt er nach seiner Entstehung durch jede Information und Interaktion mit einem Nutzenden kontinuierlich neu dazu. Er wird mit immer mehr Daten gefüttert, die in einem digitalen Gehirn zusammenlaufen.
Bei seiner Entstehung können ebenso zusätzlich Bilderkennungstools sowie Virtual Reality (VR) und Augmented Reality (AR) Animationen verwendet werden. Digital Human kreierenden Unternehmen reichen dafür – neben KI – wenige Aufnahmen eines Gesichts mit Hilfe einer Face-Capture Technologie. In Kombination mit einer 30-sekündigen Sprachaufzeichnung kann bereits in kürzester Zeit ein Digital Human entstehen.
Gegenwärtig sind die meisten Digital Humans noch blind, sie stützen ihre Interaktion ausschließlich auf das Hören. Folglich wäre das Sehvermögen der nächste Evolutionsschritt. Einmal damit ausgestattet, könnten sie uns Menschen umfassend helfen, indem sie uns virtuell über die Schulter schauen, während wir eine Aufgabe erledigen oder den Gesichtsausdruck erkennen und empathischer auf unsere Stimmung eingehen (Emotion AI).
Ihren Ursprung haben Digital Humans in der Gaming-Industrie. In Videospielen gibt es bereits länger realistisch wirkende Figuren oder Doppelgänger:innen von bekannten Personen. Es ist zugleich eine vielversprechende Technologie für die Filmbranche, um zum Beispiel Schauspieler:innen innerhalb eines Filmes jünger oder älter aussehen zu lassen. Weitere Branchen wird der Digital Human ebenso durchdringen und revolutionieren, wie das Gesundheitswesen, den Einzelhandel, Finanzsektor oder die Hotellerie, die bereits erste Use Cases umgesetzt hat.
Wo Interaktion, besonders in emotional aufgeladenen Kontexten, stattfindet, werden wir Digital Humans immer mehr begegnen. Das wird wiederum dazu führen, dass sie noch schneller und einfacher entwickelt und anpassbar gemacht werden können. Zusätzlich wird es für Nutzer:innen intuitiver, sie zu beherrschen. Auch, wenn es aktuell viele offene und ungeklärte Fragen gibt, werden sie perspektivisch großes Potenzial ausschöpfen, um die Mensch-Maschine-Schnittstellen neu gestalten zu können.
Die potenziellen Einsatzgebiete und Anwendungsfelder gehen über die oben beispielhaften Branchen weit hinaus und scheinen schier endlos, denn Digital Humans sind zukünftig in ihren vielfältigen Funktionen von großer Bedeutung – überall dort, wo Kund:innen-Engagement eine zentrale Rolle ausfüllt.
Digital Humans definieren die Art und Weise, wie Menschen mit Technologie und untereinander kommunizieren, durch die humanoide Art und Weise neu. Schlussfolgernd fügen digitale Menschen eine menschliche Verbindung zur virtuellen Welt hinzu, verbessern unsere Kommunikation und machen so unser (digitales) Leben besser. Weitere Vorteile:
Obendrein bieten sie eine vielsprechende Marktprognose: Die globale Marktgröße für digitale menschliche Avatare belief sich im Jahr 2022 auf 29,51 Milliarden US-Dollar und soll bis 2032 voraussichtlich eine durchschnittliche jährliche Wachstumsrate (CAGR) von 34,2 % verzeichnen (Quelle: Emergen Research).
Digital Humans – Ja, es gibt sie. Gewiss sind sie zum jetzigen Zeitpunkt im deutschen Raum nicht weit verbreitet. Aber sie sind da und werden bleiben. Ein Zurück zu textbasierten Lösungen wird es nicht geben. Gerade in einer visuellen Welt, in der wir leben. Zudem ist die Implementierung digitaler Menschen in einer zunehmend servicegetriebenen Welt heute einfach und die Technologie längst dafür bereit. In anderen Regionen, vorrangig in Asien, entwickeln sich Digital Humans sehr schnell, da sie dort kulturell anders akzeptiert werden. Es kann sein, dass sie auch hierzulande Veränderungen herbeiführen, die wir heute noch nicht absehen können. Abhängig davon, wie Menschen Digital Humans annehmen.
Die Herausforderungen, die es zurzeit gibt, können im Allgemeinen den meisten Produkten und Services Künstlicher (visueller) Intelligenz zugesprochen werden:
Werden Möglichkeiten und Wege gefunden, diese Herausforderungen transparent anzugehen, werden auch hier in Deutschland Digital Humans in unserer Gesellschaft eine neue Ära der sozialen Interaktion einleiten. Digital Humans werden schnelle und einfache Lösungen bieten, die uns in einer immer hektischer werdenden Welt den Alltag erleichtern und Entschleunigung bringen – sei es bei einer konkreten Problemstellung zu helfen, persönlich zu beraten oder richtige bzw. personalisierte Produkte oder Leistungen anzubieten.
Besonders im Hinblick auf das Metaverse, in denen wir neue Identitäten annehmen, oder auch in Verbindung mit dem Mikrotrend Digital Twin wird klar, dass es eine Zukunft für menschliche virtuelle Interaktion geben wird. In Kombination mit Generativer KI würden so Assistent:innen zur Verfügung stehen, die den Menschen begleiten und in der Lage sind, Informationen zu sammeln und für uns zu verarbeiten, um sie dann in unseren Dienst zu stellen. So wären Digital Humans durchaus dazu fähig, uns Menschen einige sich wiederholende und mühsame Aufgaben abzunehmen.
Digital Humans werden unsere Art der Interaktion mit der digitalen Welt natürlicher gestalten und unserer menschlichen Natur besser entsprechen. Ersetzen werden sie echte Menschen in naher Zukunft nicht. Die schöpferische Dimension ist weiterhin dem Menschen vorbehalten. Es bietet sich an, mit kleinen Use Cases zu starten und experimentieren, wie beispielsweise KI- basierten Tutorials. Wie immer gilt: Investitionen abzuwägen und klaren Mehrwert bieten.