KI-Update kompakt: Voice Engine, Amazon Olympus, Supercomputer Stargate, Pixel 8Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
Programmieren mit Python: Kommandozeilenparameter auswerten mit Python ArgparseDas Argument Parser Argparse für Python ist ein Werkzeug, das bei der Parameterauswertung hilft, schnell Ergebnisse liefert und mit Ihrem Programm wächst.
heise+ Aktionsangebot 1 Jahr heise+ zum Aktionspreis: Jetzt heise+ für nur 1,90 € pro Woche lesen und 1 Jahr lang geballtes, brandaktuelles IT- und Tech-Wissen sichern. Unbegrenzter Zugriff auf alle heise+ Beiträge inklusive der Inhalte aller Heise-Magazine. Nur bis zum 31. Mai!
ChatGPT: Warum KI-Erkennungswerkzeuge so leicht zu betrügen sindVerschiedene Programme nutzen KI, um von anderen KIs generierte Texte zu erkennen. Leider schneiden sie in der Praxis schlecht ab.
Scannen statt abtippen: Zeit sparen mit Apples Livetext auf iPhone, iPad und MacIBANs, Veranstaltungstermine, Rufnummern: Livetext nimmt Papierunterlagen ihren Schrecken. Wir verraten auch, wie Sie jeden Text und QR-Codes kopierbar machen.
Das ist fast ganz sicher eine Katze: Microsoft Azure-API für die BilderkennungVersion 4.0 des Microsoft Azure-Dienstes Computer Vision Image Analysis 4.0 macht die weitreichende Bildanalyse über eine einzelne API möglich.
Kamera-Scan-Funktion als Datenschleuder?Viele modernen Smartphones haben mittlerweile OCR-Funktionen. Läuft die Texterkennung dabei lokal oder landen Fotos und Text in der Cloud?
OCR an Bord: Wie man mit Apples Texterkennung arbeitetApples Texterkennung funktioniert gut – und kann sogar mehrseitige Dokumente übertragen. Wir zeigen, wie Entwickler sie nutzen.
Google I/O: Android 13 bietet mehr für Blinde und GehörloseBessere Braille-Unterstützung, Auswertung von Bilddateien, einen neuen Screenreader, personalisierte Geräuscherkennung und mehr zeigt Google auf der I/O.
Bild in Text umwandeln - so klappt'sSie haben ein PDF oder ein Bild, aus dem Sie den Text extrahieren möchten, ohne diesen abzutippen? Ein Tool erleichtert Ihnen die Arbeit.
Automatisierte Dateiverwaltung für macOS mit HazelViele Files landen unsortiert mit kryptischem Namen im Downloads-Ordner und sind schwer wiederzufinden. Statt manuell für Ordnung zu sorgen, helfen diese Tipps.
Barrierefreiheit: Gebärdende Avatare für Gehörlose in Websites integrierenFür viele Gehörlose ist Schriftsprache wie eine Fremdsprache. Gebärdende Avatare könnten ihnen helfen, Websites zu verstehen und sich schneller zu informieren.
Wie KI die Psychotherapie verbessern könnteMaschinelles Lernen wird mit Hilfe von Transkripten aus Patientensitzungen gefüttert. Ergebnis könnten besser funktionierende Therapieformen sein.
Texterkennung genau anpassen: Mit Python Texte in Bildern erkennenMit ein paar Zeilen Python-Code und Pytesseract lassen sich Texte in Bildern erkennen und damit durchsuchbar machen -- praktisch für fotografierte Dokumente.
Apple erbarmt sich: KI-Feature in macOS 12 Monterey auch für Intel-MacsEigentlich hatte Apple angekündigt, die Live-Text-Erkennung nur ARM-Maschinen zu gönnen. Eine neue macOS-12-Beta zeigt: Das geht auch mit Intel.
Warum KI noch immer ein Problem bei der Moderation von Hassrede hatTrotz der jüngsten Fortschritte in der Sprach-KI-Technologie hat sie immer noch Probleme mit einer der grundlegendsten Anwendungen im Social-Media-Bereich.
Online-Workshop: Automatisierte TextanalyseDer Kurs erklärt, wie man mit Natural Language Processing und Verfahren des maschinellen Lernens Texte klassifiziert, analysiert und auswertet.
Die besten Python-Projekte: Spiel programmieren, GUI erstellen, Webseite scrapenDie Programmiersprache Python ist einfach zu lernen und wird immer beliebter. Wir zeigen, wie Sie etwa Daten auf Webseiten auslesen oder coole 2D-Spiele coden.
APIs für die Spracherkennung und Textanalyse: Neues aus der Azure-AI-WeltMicrosoft erweitert die Azure Cognitive Services um vier APIs. Dabei geht es vor allem um neue Funktionen für Spracherkennung, -eingabe sowie zur Textanalyse.
Text aus kopiergeschütztem PDF anders kopierenZu der Meldung „Text aus kopiergeschütztem PDF-Dokument kopieren“ in der c’t 9/2020 haben uns Lesertipps erreicht, die je nach System einfacher funktionieren. Einige davon möchten wir vorstellen.
Text aus kopiergeschütztem PDF-Dokument kopierenWenn ich einen kurzen Text aus einem PDF-Dokument in ein anderes Programm übernehmen möchte, klappt das bei kopiergeschützten PDFs nicht. Wie geht es trotzdem?
Natürliche Sprache zielgenau verarbeiten mit semantischer TextanalyseMenschen verstehen meist die Bedeutung einer Aussage, Maschinen nicht. Prädikatenlogik hilft im Machine Learning, die Semantik hinter der Syntax zu erfassen.
Durchsuchbare PDF-Dokumente mit OCRmyPDF erstellenDas Linux-Tool OCRmyPDF macht aus eingescannten Dokumenten durchsuchbare PDF-Dateien. Bei Bedarf kann es Scans drehen und entzerren oder Bilder optimieren.