Pro Jahr 77 kreative Ideen, die es schaffen können ...

Schlagwort: AI

10/2024 Authentische Videokonferenzen mit Casablanca.AI

In der heutigen Zeit, in der Videokonferenzen zur Normalität geworden sind, spielt der Blickkontakt eine entscheidende Rolle für eine authentische Kommunikation. Leider ist es jedoch oft schwierig, diesen über Bildschirme hinweg aufrechtzuerhalten, was zu gravierenden Nachteilen führen kann. Das Start-up Casablanca.AI aus Pforzheim hat sich dieser Herausforderung angenommen und präsentiert eine revolutionäre Lösung, um Videotelefonie authentischer und effektiver zu gestalten.

Der fehlende direkte Blickkontakt bei Videokonferenzen kann das Vertrauen zwischen den Teilnehmern beeinträchtigen und die nonverbale Kommunikation einschränken. Dies hat besonders im Recruiting und im Vertrieb negative Auswirkunge.  Ein direkter Blickkontakt ist wichtig, um Persönlichkeit besser einzuschätzen und Kundenbeziehungen zu stärken. Zudem kann fehlender Blickkontakt in internen Meetings die Zusammenarbeit und Produktivität der Teammitglieder beeinträchtigen.

Die Idee hinter Casablanca.AI

Das Unternehmen, das sich vom berühmten Zitat “Schau mir in die Augen, Kleines” aus dem Film “Casablanca” inspirieren lässt, setzt Künstliche Intelligenz ein, um das Bild von Webcams zu korrigieren. Auf diese Weise wird sichergestellt, dass die Teilnehmer von Videokonferenzen sich nicht länger verpassen und der Blickkontakt erhalten bleibt. Die Gründer, allen voran der renommierte KI-Experte Carsten Kraus, haben eine innovative Technologie entwickelt, die den Kopf und den Blick digital zentriert, um eine natürliche Kommunikation zu ermöglichen.

Die Teilnahme an “Die Höhle der Löwen”

In der aktuellen Staffel der Vox-Sendung “Die Höhle der Löwen” präsentierte das Team von Casablanca.AI seine wegweisende Lösung und hoffte auf ein Investment von 500.000 Euro. Nach intensiven Verhandlungen sicherten sie sich das Interesse von Investor Carsten Maschmeyer. Leider kam es jedoch nicht zu einer endgültigen Einigung, was Kraus als bedauerlich bezeichnete.

Die Herausforderungen und Ziele des Unternehmens

Trotz der Hindernisse bleibt das Ziel von Casablanca.AI klar definiert: Sie möchten Unternehmen dabei unterstützen, Videokonferenzen produktiver, authentischer und effizienter zu gestalten. Mit einem hochqualifizierten Team von 17 Mitarbeitern, darunter erstklassige Forscher und Entwickler, arbeiten sie kontinuierlich an der Weiterentwicklung ihrer innovativen Software.

Die Zukunft von Casablanca.AI

Die Vision des Unternehmens geht über die bloße Korrektur des Blickkontakts hinaus. Sie streben danach, die gesellschaftliche Akzeptanz für ihre Technologie zu stärken, indem sie sich klar von potenziellen Missbrauchsfällen distanzieren. Ihre Software zielt darauf ab, Videokonferenzen so authentisch wie möglich zu gestalten, ohne dabei in den Bereich von Deepfakes oder ähnlichen Manipulationen zu geraten. Mit einem unermüdlichen Fokus auf Innovation und Qualität strebt Casablanca.AI danach, die Zukunft der Videokommunikation zu gestalten und einen neuen Standard für virtuelle Meetings zu setzen.

 

45/2022: DALL E 2 erzeugt Bilder aus Texten mithilfe künstlicher Intelligenz

Die neue künstliche Intelligenz von OpenAI verbreitete zuletzt großes Staunen. Mit DALL E 2 ist es nun möglich, Bilder aus geschriebenem Text entstehen zu lassen und das in guter Auflösung.

Mit DALL E 1 zog das Unternehmen bereits 2021 große Aufmerksamkeit auf sich. Auch wenn die KI, die Bilder durch Texteingaben erstellte nur von ausgewählten Forschern genutzt werden konnte und für die Öffentlichkeit Unzugänglich blieb, überraschte sie schon damals mit ihren Fähigkeiten. Die aktuelle Version DALL E 2 setzt da aber noch eine Schippe drauf und lässt alle bisher bekannten Künstlichen Intelligenzen zum generieren von Bildern im Schatten stehen.

Der Beginn von DALL E 2

DALL E 2 erschien im April 2022 und ist anders wie sein Vorgänger auch für die Öffentlichkeit über eine Warteliste zugänglich. Eine Woche nach Veröffentlichung standen bereits  100.000 auf der Warteliste, einige Monate später schon über eine Millionen. Bei der Bilderstellung ist DALL E 2 in der kreativen und visuellen Qualität um längen besser als sein Vorgänger. Mit der soliden Auflösung 1024×1024 und mehrsprachiger Textverarbeitung überzeugt die KI von fotorealistischen Portraits bis zu simulierten 3D-Renderings.

Das Prinzip der Bildgeneration

Das Prinzip der Bildgeneration bei DALL·E 2 läuft vereinfacht folgendermaßen ab:

  1. Der Prompt läuft über den Text Encoder, der ihn in den Repräsentationsraum projiziert. Dort ordnet CLIP die textuelle und die visuelle Ebene paarweise zu. Das neuronale Netz ist darauf trainiert festzustellen, inwieweit eine Textbeschreibung zu einem Bild passt. Der Schritt steht für das Semantisieren der Textebene in Bezug auf das Visuelle.
  2. Es entsteht ein sogenanntes Prior: kein fertiges Bild, sondern lediglich eine Bildrepräsentation. Hier kommt mit GLIDE ein sogenanntes Diffusionsmodell von OpenAI zum Einsatz. Dabei wird ein künstliches neuronales Netz mit Fotos so lange immer mehr mit Rauschen belegt, bis nichts mehr erkennbar ist. Danach wird der Vorgang umgekehrt, sodass das System aus dem Rauschen fotorealistische Bilder nach Vorgaben schafft.
  3. Der Prior mit der Text-Bild-Semantik generiert über Diffusionsumkehrung eine Reihe von Bildern, die das System wiederum mit CLIP semantisch sortiert und die die aus seiner Sicht besten als Ergebnis anzeigt.

Der Prozess dauert etwa 20 Sekunden und lässt zwischen sechs und zehn Bildern entstehen um eine Auswahl an Variationen bereitzustellen.

Die KI kann nicht nur neue Bilder nach gewünschten Stilrichtungen entstehen lassen, sondern auch vorhandene Retuschieren.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

© 2024 RAKETENSTART

Theme von Anders NorénHoch ↑