JPEGs nach Binarisierung

Moderator: Moderatoren Forum 4

Antworten
Benutzeravatar
Liegestuhl
Moderator
Beiträge: 40978
Registriert: Mo 2. Jun 2008, 12:04
user title: Herzls Helfer
Wohnort: אולדנבורג

JPEGs nach Binarisierung

Beitrag von Liegestuhl »

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg
Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?
Ich schulde dem Leben das Leuchten in meinen Augen.
Benutzeravatar
frems
Beiträge: 47101
Registriert: Sa 4. Apr 2009, 14:43
user title: Hochenergetisch
Wohnort: Hamburg, Europa

Re: JPEGs nach Binarisierung

Beitrag von frems »

Weil mehr Daten. JPEG lebt doch davon, unwichtigen Kram (z.B. weiße Flächen) wegzulassen. Machste künstliche die AUflösung größer, wird das Bild auch größer, obwohl es faktisch (fürs Auge) keine neuen Informationen gibt. Es gibt aber entstandene Lücken, die gefüllt werden durch Vermutungen, die dann wieder abgespeichert werden. Ich empfehle einfach einfache Online-Tools, z.B. hier, Bild hochladen (oder per URL verlinken) und fertig ist die Laube.
Labskaus!

Ob Mailand oder Madrid -- Hauptsache Europa.
Benutzeravatar
garfield336
Beiträge: 14068
Registriert: Mo 25. Mär 2013, 21:05
Wohnort: Luxemburg

Re: JPEGs nach Binarisierung

Beitrag von garfield336 »

Die Erklärung zu -color 2

Code: Alles auswählen

Set the preferred number of colors in the image.

The actual number of colors in the image may be less than your request, but never more. Note that this a color reduction option. Images with fewer unique colors than specified by value will have any duplicate or unused colors removed. The ordering of an existing color palette may be altered. When converting an image from color to grayscale, it is more efficient to convert the image to the gray colorspace before reducing the number of colors. Refer to the color reduction algorithm for more details.
Im Klartext, dies funktionniert so nicht
Benutzeravatar
Liegestuhl
Moderator
Beiträge: 40978
Registriert: Mo 2. Jun 2008, 12:04
user title: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitrag von Liegestuhl »

frems hat geschrieben:(01 Jun 2016, 16:05)

Weil mehr Daten. JPEG lebt doch davon, unwichtigen Kram (z.B. weiße Flächen) wegzulassen.
Aber durch den Wegfall der Farbnuancen müssten doch größere und zusammenhängendere Flächen entstehen.
Ich empfehle einfach einfache Online-Tools, z.B. hier, Bild hochladen (oder per URL verlinken) und fertig ist die Laube.
http://i.imgur.com/sWtWZY2.jpg

Supi!
Ich schulde dem Leben das Leuchten in meinen Augen.
Benutzeravatar
garfield336
Beiträge: 14068
Registriert: Mo 25. Mär 2013, 21:05
Wohnort: Luxemburg

Re: JPEGs nach Binarisierung

Beitrag von garfield336 »

Du hast mit einstellung auf colorspace gray, die Zahl der Farbtöne nicht reduziert sondern noch vergrössert.

Klingt absurd, ist aber so.
Benutzeravatar
Liegestuhl
Moderator
Beiträge: 40978
Registriert: Mo 2. Jun 2008, 12:04
user title: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitrag von Liegestuhl »

garfield336 hat geschrieben:(01 Jun 2016, 16:17)

Du hast mit einstellung auf colorspace gray, die Zahl der Farbtöne nicht reduziert sondern noch vergrössert.

Klingt absurd, ist aber so.

Habs jetzt mit

Code: Alles auswählen

convert 38.jpg -monochrome 38xx.jpg
versucht, aber das Ergebnis ging gar nicht.
Ich schulde dem Leben das Leuchten in meinen Augen.
Benutzeravatar
H2O
Moderator
Beiträge: 46989
Registriert: So 13. Sep 2015, 13:49
Wohnort: Zachodniopomorze

Re: JPEGs nach Binarisierung

Beitrag von H2O »

Liegestuhl hat geschrieben:(01 Jun 2016, 15:58)

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg
Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?
Hilft nix; das Bildkompressionsverfahren verschmiert durch Filterung scharfe Konturen, wie man sie ja bei Textkopien haben möchte. Wenn Sie also starke Kompression gewählt haben, dann wird Ihr Text nur mit jedem Bearbeitungsschritt schlechter.

Ich habe mir ganz einfach einmal das hier angesehen und überflogen:

https://en.wikipedia.org/wiki/JPEG
  • On the other hand, JPEG may not be as well suited for line drawings and other textual or iconic graphics, where the sharp contrasts between adjacent pixels can cause noticeable artifacts. Such images may be better saved in a lossless graphics format such as TIFF, GIF, PNG, or a raw image format. The JPEG standard actually includes a lossless coding mode, but that mode is not supported in most products.
Benutzeravatar
nichtkorrekt
Beiträge: 6485
Registriert: So 19. Aug 2012, 12:10
Wohnort: Neufünfland

Re: JPEGs nach Binarisierung

Beitrag von nichtkorrekt »

Irfanview ist finde ich ein gutes kostenloses Tool, vielleicht hast du damit Glück, als Gifs zu speichern spart meine ich auch Speicherplatz.
Wer nicht AfD wählt, wählt Merkel.
Benutzeravatar
frems
Beiträge: 47101
Registriert: Sa 4. Apr 2009, 14:43
user title: Hochenergetisch
Wohnort: Hamburg, Europa

Re: JPEGs nach Binarisierung

Beitrag von frems »

Liegestuhl hat geschrieben:(01 Jun 2016, 16:28)

Habs jetzt mit

Code: Alles auswählen

convert 38.jpg -monochrome 38xx.jpg
versucht, aber das Ergebnis ging gar nicht.
Warum lässt Du es nicht einfach Schwarz-Weiß?
Labskaus!

Ob Mailand oder Madrid -- Hauptsache Europa.
Benutzeravatar
3x schwarzer Kater
Beiträge: 25724
Registriert: Mo 26. Mai 2014, 16:25
user title: Do legst di nieda
Wohnort: Schwaben

Re: JPEGs nach Binarisierung

Beitrag von 3x schwarzer Kater »

Liegestuhl hat geschrieben:(01 Jun 2016, 15:58)

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg
Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?
Kannst du mir mal eine Seite zur Verfügung stellen? Ich würde später am PC gerne was ausprobieren.
„Es wurde schon alles gesagt, nur noch nicht von jedem.“ (Karl Valentin)
Benutzeravatar
Liegestuhl
Moderator
Beiträge: 40978
Registriert: Mo 2. Jun 2008, 12:04
user title: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitrag von Liegestuhl »

3x schwarzer Kater hat geschrieben:(01 Jun 2016, 16:41)

Kannst du mir mal eine Seite zur Verfügung stellen? Ich würde später am PC gerne was ausprobieren.
http://i.imgur.com/90lKb8Q.jpg
Ich schulde dem Leben das Leuchten in meinen Augen.
Benutzeravatar
frems
Beiträge: 47101
Registriert: Sa 4. Apr 2009, 14:43
user title: Hochenergetisch
Wohnort: Hamburg, Europa

Re: JPEGs nach Binarisierung

Beitrag von frems »

Hau die Grautöne weg! Dann kommst Du schon auf weniger als die Hälfte der Größe: http://i.imgur.com/gRGm2Zi.png (234 KB)

Wenn Du dann noch etwas mit der Qualität und Größe spielst, kannste das problemlos auf unter 100 KB kriegen. (Kostet aber etwas Zeit, ich hab bei den Feineinstellungen keine Sekunde investiert, weshalb manch Ecke etwas spitz aussieht)
Labskaus!

Ob Mailand oder Madrid -- Hauptsache Europa.
Benutzeravatar
Liegestuhl
Moderator
Beiträge: 40978
Registriert: Mo 2. Jun 2008, 12:04
user title: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitrag von Liegestuhl »

frems hat geschrieben:(01 Jun 2016, 17:19)
Wenn Du dann noch etwas mit der Qualität und Größe spielst, kannste das problemlos auf unter 100 KB kriegen.
Das ist die gleiche Seite nur auf 450x645 heruntergesized. Es hat nur 108 KB.

http://i.imgur.com/WrPVFMY.jpg

Es lässt sich im Vergleich zur BW-Seite aber viel besser lesen.
Ich schulde dem Leben das Leuchten in meinen Augen.
Benutzeravatar
H2O
Moderator
Beiträge: 46989
Registriert: So 13. Sep 2015, 13:49
Wohnort: Zachodniopomorze

Re: JPEGs nach Binarisierung

Beitrag von H2O »

frems hat geschrieben:(01 Jun 2016, 17:19)

Hau die Grautöne weg! Dann kommst Du schon auf weniger als die Hälfte der Größe: http://i.imgur.com/gRGm2Zi.png (234 KB)

Wenn Du dann noch etwas mit der Qualität und Größe spielst, kannste das problemlos auf unter 100 KB kriegen. (Kostet aber etwas Zeit, ich hab bei den Feineinstellungen keine Sekunde investiert, weshalb manch Ecke etwas spitz aussieht)
Warum nicht erst einmal lesen, was die Bildverarbeiter zu JPEG anmerken:

https://en.wikipedia.org/wiki/JPEG
  • On the other hand, JPEG may not be as well suited for line drawings and other textual or iconic graphics, where the sharp contrasts between adjacent pixels can cause noticeable artifacts. Such images may be better saved in a lossless graphics format such as TIFF, GIF, PNG, or a raw image format. The JPEG standard actually includes a lossless coding mode, but that mode is not supported in most products.

    As the typical use of JPEG is a lossy compression method, which somewhat reduces the image fidelity, it should not be used in scenarios where the exact reproduction of the data is required (such as some scientific and medical imaging applications and certain technical image processing work).

    JPEG is also not well suited to files that will undergo multiple edits, as some image quality will usually be lost each time the image is decompressed and recompressed, particularly if the image is cropped or shifted, or if encoding parameters are changed – see digital generation loss for details. To avoid this, an image that is being modified or may be modified in the future can be saved in a lossless format, with a copy exported as JPEG for distribution.
Der Teilnehmer Liegestuhl hat seine Textseiten in Farbe in JPEG kopiert. Ohne jeden Zweifel bekommt er auch eine leserliche Kopie davon, wenn er nicht weitere Bearbeitungsschritte folgen läßt. Das will er aber tun, um noch mehr Daten ein zu sparen,, und um damit weiter in das Verarbeitungsverfahren eingreifen.

Texte sind keine flächigen und flächenfüllenden Darstellungen. Für Textkopien ist JPEG mit Kompression aber nicht entwickelt worden... wenn Textkopien auch ganz gut damit funktionieren, wenn der Kompressionsgrad nicht so hoch getrieben wird. Die Farboption bläht aber nur die erzeugten Daten auf. Das war der erste Trugschluß, damit etwa mehr Abbildungstreue erzielen zu wollen.

Wenn es nur um die Kopie eines gedruckten Texts ginge, dann könnte ein Texterkennungsverfahren OCR auf die kopierten Seiten angewandt werden. Das geht nicht ganz ohne Korrekturlesen und Korrekturen, könnte danach aber als ganz gewöhnliches Textdokument gespeichert werden zu einem winzigen Bruchteil einer Bildspeicherung. Wie weit OCR heute noch verfügbar sind... keinen Schimmer, lang, lang ist's her.

Nachbemerkung:
Au ha, das ist ja mehrfach formatierter Text; da wird natürlich OCR nichts Gutes reißen. Das von Liegestuhl erzielte Ergebnis ist aber schon ganz anständig, meine ich!
Benutzeravatar
Tom Bombadil
Beiträge: 73006
Registriert: Sa 31. Mai 2008, 16:27
user title: Non Soli Cedit

Re: JPEGs nach Binarisierung

Beitrag von Tom Bombadil »

http://imgur.com/ds6MLPj

300kb und besser lesbar.

In GIMP das Bild in Graustufen umwandeln, dann unter "Farben" - "Werte" den Grauschleier wegnehmen, dort danach die Schrift schwärzen (geht beides mit diesen kleinen Dreiecken unterhalb des Histogramms) und dann als jpeg mit 75% speichern. Geht bestimmt auch noch weiter runter einfach mal experimentieren.

Skaliert nur noch 70kb: http://imgur.com/OKC1AE5
The tree of liberty must be refreshed from time to time with the blood of patriots and tyrants. It is its natural manure.
Thomas Jefferson
---
Diffamierer der Linken.
Benutzeravatar
3x schwarzer Kater
Beiträge: 25724
Registriert: Mo 26. Mai 2014, 16:25
user title: Do legst di nieda
Wohnort: Schwaben

Re: JPEGs nach Binarisierung

Beitrag von 3x schwarzer Kater »

Tom Bombadil hat geschrieben:(02 Jun 2016, 08:57)

http://imgur.com/ds6MLPj

300kb und besser lesbar.

In GIMP das Bild in Graustufen umwandeln, dann unter "Farben" - "Werte" den Grauschleier wegnehmen, dort danach die Schrift schwärzen (geht beides mit diesen kleinen Dreiecken unterhalb des Histogramms) und dann als jpeg mit 75% speichern. Geht bestimmt auch noch weiter runter einfach mal experimentieren.

Skaliert nur noch 70kb: http://imgur.com/OKC1AE5
Nach meinem Verständnis hat er aber über 300 Dateien, die er in GIMP einzeln bearbeiten müsste. Ich hab's gestern mal mit Raw Therapee versucht. Ist eigentlich zur Bearbeitung von Raw Dateien, funktioniert aber auch bei JPEG. Sollten die Dateien allesamt etwa ähnlich zu korrigieren sein, könnte man dann alle auf einmal einstellen und im Batch abarbeiten lassen. Bin aber gestern auf die Schnelle nur auf 250kb gekommen. Da müsste man wohl noch etwas rumprobieren.

Raw Therapee ist eine Freeware.
„Es wurde schon alles gesagt, nur noch nicht von jedem.“ (Karl Valentin)
Benutzeravatar
Tom Bombadil
Beiträge: 73006
Registriert: Sa 31. Mai 2008, 16:27
user title: Non Soli Cedit

Re: JPEGs nach Binarisierung

Beitrag von Tom Bombadil »

Womit sollen die Bilder denn überhaupt weiter verarbeitet werden?
The tree of liberty must be refreshed from time to time with the blood of patriots and tyrants. It is its natural manure.
Thomas Jefferson
---
Diffamierer der Linken.
Benutzeravatar
Liegestuhl
Moderator
Beiträge: 40978
Registriert: Mo 2. Jun 2008, 12:04
user title: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitrag von Liegestuhl »

Ich würde die JPEGs mit Imagemagick als Konsolenprogramm weiterverarbeiten.

Zum einfachen Resizen (wie ich es jetzt als eine Option mache)

Code: Alles auswählen

#!/bin/bash
for file in *.jpg
  do convert "$file" -resize 450x645 test/"$file"
  echo $(date +"%D") $(date +"%T") "$file" >> convlog.txt
done

Für das Zusammenfügen der JPEGs zum PDF hatte ich mir schon ein Caja (Nautilus)-Script geschrieben. Das brauche ich für meine alltägliche Scannerei ohnehin.
Ich schulde dem Leben das Leuchten in meinen Augen.
bennyh

Re: JPEGs nach Binarisierung

Beitrag von bennyh »

Liegestuhl hat geschrieben:(01 Jun 2016, 15:58)

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg
Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?
Garfield hat vollkommen recht, -colors 2 ist sowohl unnötig als auch kontraproduktiv, also weglassen.
Sie müssen den Kompressionsgrad der JPEG-Kodierung erhöhen. Standardmäßig macht Imagemagick eine verlustfreie Komprimierung, was einem Qualitätsfaktor von 100% entspricht. Mit -quality XX können Sie angeben, auf wieviel Prozent der Qualitätsfaktor heruntergestuft werden soll.
Alternativ können Sie mit der Option -define jpeg:extent=XXX, was die maximale Dateigröße sein soll. Also beispielsweise

Code: Alles auswählen

convert 90lKb8Q.jpg -colorspace gray -contrast-stretch 0 -define jpeg:extent=100KB test.jpg
komprimiert die Datei, bis sie 100kb groß ist. Das Ergebnis ist ganz ordentlich. Ein Herunterskalieren der Bildgröße ist wahrscheinlich gar nicht erforderlich.
Benutzeravatar
BlueMonday
Beiträge: 3794
Registriert: Mo 14. Jan 2013, 17:13
user title: Waldgänger&Klimaoptimist

Re: JPEGs nach Binarisierung

Beitrag von BlueMonday »

Wenn man nur 2 Farben/1bit pro Pixel verwenden will, sollte man auch zu png oder gif greifen, da diese Formate diese Farbtiefe effektiv unterstützen. jpeg verfolgt einen ganz anderen Kompressionsansatz("Quantisierung").

1227 x 1758 px, 1bit Farbtiefe, png -> ca. 68kb

http://imgur.com/fGFznxM
ensure that citizens are informed that the vaccination is not mandatory and that no one is under political, social or other pressure to be vaccinated if they do not wish to do so;
Antworten