JPEGs nach Binarisierung

Moderator: Moderatoren Forum 4

Benutzeravatar
Liegestuhl
Beiträge: 35245
Registriert: Mo 2. Jun 2008, 11:04
Benutzertitel: Herzls Helfer
Wohnort: אולדנבורג

JPEGs nach Binarisierung

Beitragvon Liegestuhl » Mi 1. Jun 2016, 14:58

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg


Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?
Ein Hütchen mit Federn, die Armbrust über der Schulter, aber ein Jäger ist es nicht.
Benutzeravatar
frems
Moderator
Beiträge: 42622
Registriert: Sa 4. Apr 2009, 13:43
Benutzertitel: Hochenergetisch
Wohnort: Hamburg, Europa

Re: JPEGs nach Binarisierung

Beitragvon frems » Mi 1. Jun 2016, 15:05

Weil mehr Daten. JPEG lebt doch davon, unwichtigen Kram (z.B. weiße Flächen) wegzulassen. Machste künstliche die AUflösung größer, wird das Bild auch größer, obwohl es faktisch (fürs Auge) keine neuen Informationen gibt. Es gibt aber entstandene Lücken, die gefüllt werden durch Vermutungen, die dann wieder abgespeichert werden. Ich empfehle einfach einfache Online-Tools, z.B. hier, Bild hochladen (oder per URL verlinken) und fertig ist die Laube.
Labskaus!

Ob Mailand oder Madrid -- Hauptsache Europa.
Benutzeravatar
garfield336
Beiträge: 9358
Registriert: Mo 25. Mär 2013, 21:05

Re: JPEGs nach Binarisierung

Beitragvon garfield336 » Mi 1. Jun 2016, 15:08

Die Erklärung zu -color 2

Code: Alles auswählen

Set the preferred number of colors in the image.

The actual number of colors in the image may be less than your request, but never more. Note that this a color reduction option. Images with fewer unique colors than specified by value will have any duplicate or unused colors removed. The ordering of an existing color palette may be altered. When converting an image from color to grayscale, it is more efficient to convert the image to the gray colorspace before reducing the number of colors. Refer to the color reduction algorithm for more details.


Im Klartext, dies funktionniert so nicht
Benutzeravatar
Liegestuhl
Beiträge: 35245
Registriert: Mo 2. Jun 2008, 11:04
Benutzertitel: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitragvon Liegestuhl » Mi 1. Jun 2016, 15:15

frems hat geschrieben:(01 Jun 2016, 16:05)

Weil mehr Daten. JPEG lebt doch davon, unwichtigen Kram (z.B. weiße Flächen) wegzulassen.

Aber durch den Wegfall der Farbnuancen müssten doch größere und zusammenhängendere Flächen entstehen.

Ich empfehle einfach einfache Online-Tools, z.B. hier, Bild hochladen (oder per URL verlinken) und fertig ist die Laube.


http://i.imgur.com/sWtWZY2.jpg

Supi!
Ein Hütchen mit Federn, die Armbrust über der Schulter, aber ein Jäger ist es nicht.
Benutzeravatar
garfield336
Beiträge: 9358
Registriert: Mo 25. Mär 2013, 21:05

Re: JPEGs nach Binarisierung

Beitragvon garfield336 » Mi 1. Jun 2016, 15:17

Du hast mit einstellung auf colorspace gray, die Zahl der Farbtöne nicht reduziert sondern noch vergrössert.

Klingt absurd, ist aber so.
Benutzeravatar
Liegestuhl
Beiträge: 35245
Registriert: Mo 2. Jun 2008, 11:04
Benutzertitel: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitragvon Liegestuhl » Mi 1. Jun 2016, 15:28

garfield336 hat geschrieben:(01 Jun 2016, 16:17)

Du hast mit einstellung auf colorspace gray, die Zahl der Farbtöne nicht reduziert sondern noch vergrössert.

Klingt absurd, ist aber so.



Habs jetzt mit

Code: Alles auswählen

convert 38.jpg -monochrome 38xx.jpg


versucht, aber das Ergebnis ging gar nicht.
Ein Hütchen mit Federn, die Armbrust über der Schulter, aber ein Jäger ist es nicht.
Benutzeravatar
H2O
Beiträge: 13531
Registriert: So 13. Sep 2015, 12:49

Re: JPEGs nach Binarisierung

Beitragvon H2O » Mi 1. Jun 2016, 15:39

Liegestuhl hat geschrieben:(01 Jun 2016, 15:58)

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg


Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?


Hilft nix; das Bildkompressionsverfahren verschmiert durch Filterung scharfe Konturen, wie man sie ja bei Textkopien haben möchte. Wenn Sie also starke Kompression gewählt haben, dann wird Ihr Text nur mit jedem Bearbeitungsschritt schlechter.

Ich habe mir ganz einfach einmal das hier angesehen und überflogen:

https://en.wikipedia.org/wiki/JPEG

    On the other hand, JPEG may not be as well suited for line drawings and other textual or iconic graphics, where the sharp contrasts between adjacent pixels can cause noticeable artifacts. Such images may be better saved in a lossless graphics format such as TIFF, GIF, PNG, or a raw image format. The JPEG standard actually includes a lossless coding mode, but that mode is not supported in most products.
Benutzeravatar
nichtkorrekt
Beiträge: 6485
Registriert: So 19. Aug 2012, 11:10
Wohnort: Neufünfland

Re: JPEGs nach Binarisierung

Beitragvon nichtkorrekt » Mi 1. Jun 2016, 15:40

Irfanview ist finde ich ein gutes kostenloses Tool, vielleicht hast du damit Glück, als Gifs zu speichern spart meine ich auch Speicherplatz.
Wer nicht AfD wählt, wählt Merkel.
Benutzeravatar
frems
Moderator
Beiträge: 42622
Registriert: Sa 4. Apr 2009, 13:43
Benutzertitel: Hochenergetisch
Wohnort: Hamburg, Europa

Re: JPEGs nach Binarisierung

Beitragvon frems » Mi 1. Jun 2016, 15:40

Liegestuhl hat geschrieben:(01 Jun 2016, 16:28)

Habs jetzt mit

Code: Alles auswählen

convert 38.jpg -monochrome 38xx.jpg


versucht, aber das Ergebnis ging gar nicht.

Warum lässt Du es nicht einfach Schwarz-Weiß?
Labskaus!

Ob Mailand oder Madrid -- Hauptsache Europa.
Benutzeravatar
3x schwarzer Kater
Vorstand
Beiträge: 13698
Registriert: Mo 26. Mai 2014, 15:25
Benutzertitel: Do legst di nieda
Wohnort: Lower Bavaria

Re: JPEGs nach Binarisierung

Beitragvon 3x schwarzer Kater » Mi 1. Jun 2016, 15:41

Liegestuhl hat geschrieben:(01 Jun 2016, 15:58)

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg


Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?


Kannst du mir mal eine Seite zur Verfügung stellen? Ich würde später am PC gerne was ausprobieren.
„Fremd ist der Fremde nur in der Fremde.“ (Karl Valentin)
Benutzeravatar
Liegestuhl
Beiträge: 35245
Registriert: Mo 2. Jun 2008, 11:04
Benutzertitel: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitragvon Liegestuhl » Mi 1. Jun 2016, 16:10

3x schwarzer Kater hat geschrieben:(01 Jun 2016, 16:41)

Kannst du mir mal eine Seite zur Verfügung stellen? Ich würde später am PC gerne was ausprobieren.


http://i.imgur.com/90lKb8Q.jpg
Ein Hütchen mit Federn, die Armbrust über der Schulter, aber ein Jäger ist es nicht.
Benutzeravatar
frems
Moderator
Beiträge: 42622
Registriert: Sa 4. Apr 2009, 13:43
Benutzertitel: Hochenergetisch
Wohnort: Hamburg, Europa

Re: JPEGs nach Binarisierung

Beitragvon frems » Mi 1. Jun 2016, 16:19


Hau die Grautöne weg! Dann kommst Du schon auf weniger als die Hälfte der Größe: http://i.imgur.com/gRGm2Zi.png (234 KB)

Wenn Du dann noch etwas mit der Qualität und Größe spielst, kannste das problemlos auf unter 100 KB kriegen. (Kostet aber etwas Zeit, ich hab bei den Feineinstellungen keine Sekunde investiert, weshalb manch Ecke etwas spitz aussieht)
Labskaus!

Ob Mailand oder Madrid -- Hauptsache Europa.
Benutzeravatar
Liegestuhl
Beiträge: 35245
Registriert: Mo 2. Jun 2008, 11:04
Benutzertitel: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitragvon Liegestuhl » Mi 1. Jun 2016, 16:43

frems hat geschrieben:(01 Jun 2016, 17:19)
Wenn Du dann noch etwas mit der Qualität und Größe spielst, kannste das problemlos auf unter 100 KB kriegen.


Das ist die gleiche Seite nur auf 450x645 heruntergesized. Es hat nur 108 KB.

http://i.imgur.com/WrPVFMY.jpg

Es lässt sich im Vergleich zur BW-Seite aber viel besser lesen.
Ein Hütchen mit Federn, die Armbrust über der Schulter, aber ein Jäger ist es nicht.
Benutzeravatar
H2O
Beiträge: 13531
Registriert: So 13. Sep 2015, 12:49

Re: JPEGs nach Binarisierung

Beitragvon H2O » Mi 1. Jun 2016, 16:45

frems hat geschrieben:(01 Jun 2016, 17:19)

Hau die Grautöne weg! Dann kommst Du schon auf weniger als die Hälfte der Größe: http://i.imgur.com/gRGm2Zi.png (234 KB)

Wenn Du dann noch etwas mit der Qualität und Größe spielst, kannste das problemlos auf unter 100 KB kriegen. (Kostet aber etwas Zeit, ich hab bei den Feineinstellungen keine Sekunde investiert, weshalb manch Ecke etwas spitz aussieht)


Warum nicht erst einmal lesen, was die Bildverarbeiter zu JPEG anmerken:

https://en.wikipedia.org/wiki/JPEG

    On the other hand, JPEG may not be as well suited for line drawings and other textual or iconic graphics, where the sharp contrasts between adjacent pixels can cause noticeable artifacts. Such images may be better saved in a lossless graphics format such as TIFF, GIF, PNG, or a raw image format. The JPEG standard actually includes a lossless coding mode, but that mode is not supported in most products.

    As the typical use of JPEG is a lossy compression method, which somewhat reduces the image fidelity, it should not be used in scenarios where the exact reproduction of the data is required (such as some scientific and medical imaging applications and certain technical image processing work).

    JPEG is also not well suited to files that will undergo multiple edits, as some image quality will usually be lost each time the image is decompressed and recompressed, particularly if the image is cropped or shifted, or if encoding parameters are changed – see digital generation loss for details. To avoid this, an image that is being modified or may be modified in the future can be saved in a lossless format, with a copy exported as JPEG for distribution.

Der Teilnehmer Liegestuhl hat seine Textseiten in Farbe in JPEG kopiert. Ohne jeden Zweifel bekommt er auch eine leserliche Kopie davon, wenn er nicht weitere Bearbeitungsschritte folgen läßt. Das will er aber tun, um noch mehr Daten ein zu sparen,, und um damit weiter in das Verarbeitungsverfahren eingreifen.

Texte sind keine flächigen und flächenfüllenden Darstellungen. Für Textkopien ist JPEG mit Kompression aber nicht entwickelt worden... wenn Textkopien auch ganz gut damit funktionieren, wenn der Kompressionsgrad nicht so hoch getrieben wird. Die Farboption bläht aber nur die erzeugten Daten auf. Das war der erste Trugschluß, damit etwa mehr Abbildungstreue erzielen zu wollen.

Wenn es nur um die Kopie eines gedruckten Texts ginge, dann könnte ein Texterkennungsverfahren OCR auf die kopierten Seiten angewandt werden. Das geht nicht ganz ohne Korrekturlesen und Korrekturen, könnte danach aber als ganz gewöhnliches Textdokument gespeichert werden zu einem winzigen Bruchteil einer Bildspeicherung. Wie weit OCR heute noch verfügbar sind... keinen Schimmer, lang, lang ist's her.

Nachbemerkung:
Au ha, das ist ja mehrfach formatierter Text; da wird natürlich OCR nichts Gutes reißen. Das von Liegestuhl erzielte Ergebnis ist aber schon ganz anständig, meine ich!
Benutzeravatar
Tom Bombadil
Beiträge: 29171
Registriert: Sa 31. Mai 2008, 15:27
Benutzertitel: Non Soli Cedit

Re: JPEGs nach Binarisierung

Beitragvon Tom Bombadil » Do 2. Jun 2016, 07:57

http://imgur.com/ds6MLPj

300kb und besser lesbar.

In GIMP das Bild in Graustufen umwandeln, dann unter "Farben" - "Werte" den Grauschleier wegnehmen, dort danach die Schrift schwärzen (geht beides mit diesen kleinen Dreiecken unterhalb des Histogramms) und dann als jpeg mit 75% speichern. Geht bestimmt auch noch weiter runter einfach mal experimentieren.

Skaliert nur noch 70kb: http://imgur.com/OKC1AE5
The tree of liberty must be refreshed from time to time with the blood of patriots and tyrants. It is its natural manure.
Thomas Jefferson
Benutzeravatar
3x schwarzer Kater
Vorstand
Beiträge: 13698
Registriert: Mo 26. Mai 2014, 15:25
Benutzertitel: Do legst di nieda
Wohnort: Lower Bavaria

Re: JPEGs nach Binarisierung

Beitragvon 3x schwarzer Kater » Do 2. Jun 2016, 09:29

Tom Bombadil hat geschrieben:(02 Jun 2016, 08:57)

http://imgur.com/ds6MLPj

300kb und besser lesbar.

In GIMP das Bild in Graustufen umwandeln, dann unter "Farben" - "Werte" den Grauschleier wegnehmen, dort danach die Schrift schwärzen (geht beides mit diesen kleinen Dreiecken unterhalb des Histogramms) und dann als jpeg mit 75% speichern. Geht bestimmt auch noch weiter runter einfach mal experimentieren.

Skaliert nur noch 70kb: http://imgur.com/OKC1AE5


Nach meinem Verständnis hat er aber über 300 Dateien, die er in GIMP einzeln bearbeiten müsste. Ich hab's gestern mal mit Raw Therapee versucht. Ist eigentlich zur Bearbeitung von Raw Dateien, funktioniert aber auch bei JPEG. Sollten die Dateien allesamt etwa ähnlich zu korrigieren sein, könnte man dann alle auf einmal einstellen und im Batch abarbeiten lassen. Bin aber gestern auf die Schnelle nur auf 250kb gekommen. Da müsste man wohl noch etwas rumprobieren.

Raw Therapee ist eine Freeware.
„Fremd ist der Fremde nur in der Fremde.“ (Karl Valentin)
Benutzeravatar
Tom Bombadil
Beiträge: 29171
Registriert: Sa 31. Mai 2008, 15:27
Benutzertitel: Non Soli Cedit

Re: JPEGs nach Binarisierung

Beitragvon Tom Bombadil » Do 2. Jun 2016, 11:54

Womit sollen die Bilder denn überhaupt weiter verarbeitet werden?
The tree of liberty must be refreshed from time to time with the blood of patriots and tyrants. It is its natural manure.
Thomas Jefferson
Benutzeravatar
Liegestuhl
Beiträge: 35245
Registriert: Mo 2. Jun 2008, 11:04
Benutzertitel: Herzls Helfer
Wohnort: אולדנבורג

Re: JPEGs nach Binarisierung

Beitragvon Liegestuhl » Do 2. Jun 2016, 12:12

Ich würde die JPEGs mit Imagemagick als Konsolenprogramm weiterverarbeiten.

Zum einfachen Resizen (wie ich es jetzt als eine Option mache)

Code: Alles auswählen

#!/bin/bash
for file in *.jpg
  do convert "$file" -resize 450x645 test/"$file"
  echo $(date +"%D") $(date +"%T") "$file" >> convlog.txt
done



Für das Zusammenfügen der JPEGs zum PDF hatte ich mir schon ein Caja (Nautilus)-Script geschrieben. Das brauche ich für meine alltägliche Scannerei ohnehin.
Ein Hütchen mit Federn, die Armbrust über der Schulter, aber ein Jäger ist es nicht.
Benutzeravatar
bennyh
Beiträge: 4258
Registriert: Sa 23. Feb 2013, 10:58
Benutzertitel: Verwarn.: 1
Wohnort: 123 Fake street

Re: JPEGs nach Binarisierung

Beitragvon bennyh » Mi 22. Jun 2016, 09:54

Liegestuhl hat geschrieben:(01 Jun 2016, 15:58)

Folgendes Problem:

Ich habe mir ein Buch abgescannt, welches nicht mehr käuflich erhältlich ist und die 350 Seiten als farbige JPEGs abgespeichert. Da die Dateien relativ groß sind (500KB) und ich sie später als PDF zusammenfügen möchte, würde ich die Datenmenge gerne reduzieren. Da es sich ausschließlich um geschriebenen Text (schwarz auf weiß) handelt, hatte ich mir gedacht, dass ich die Seiten binarisiere.

Mit Imagemagick sieht das folgendermaßen aus.

Code: Alles auswählen

convert 38.jpg -colors 2 -colorspace gray -contrast-stretch 0 38inbw.jpg


Das überraschende Ergebnis war, dass die Datei 38inbw.jpg von 500 KB auf 1100 KB angewachsen ist. Ähnliche Ergebnisse erhalte ich, wenn ich sie mit GIMP umwandele. Selbst das Optimieren mit jpegoptim ergibt keine entscheidend besseren Ergebnisse.

Die besten Ergebnisse zur Datenreduktion habe ich bisher bekommen, in dem ich das farbige Bild auf 25% skaliert und die Kompressionqualität gesenkt habe. Die Dateien sind danach noch 100KB groß. Das wäre akzeptabel.

Aber warumbekomme ich mit einer Binarisierung keine besseren Ergebnisse?

Garfield hat vollkommen recht, -colors 2 ist sowohl unnötig als auch kontraproduktiv, also weglassen.
Sie müssen den Kompressionsgrad der JPEG-Kodierung erhöhen. Standardmäßig macht Imagemagick eine verlustfreie Komprimierung, was einem Qualitätsfaktor von 100% entspricht. Mit -quality XX können Sie angeben, auf wieviel Prozent der Qualitätsfaktor heruntergestuft werden soll.
Alternativ können Sie mit der Option -define jpeg:extent=XXX, was die maximale Dateigröße sein soll. Also beispielsweise

Code: Alles auswählen

convert 90lKb8Q.jpg -colorspace gray -contrast-stretch 0 -define jpeg:extent=100KB test.jpg

komprimiert die Datei, bis sie 100kb groß ist. Das Ergebnis ist ganz ordentlich. Ein Herunterskalieren der Bildgröße ist wahrscheinlich gar nicht erforderlich.
Best of pn:
- "Kannst du deine blöde Fresse nicht halten? Ich antworte nicht auf deine Zitate, also verpiss dich."
"Wennst mit der deppaten Fußzeile ofoahst, wars scho ghuifn."
Benutzeravatar
BlueMonday
Beiträge: 1402
Registriert: Mo 14. Jan 2013, 17:13

Re: JPEGs nach Binarisierung

Beitragvon BlueMonday » Mi 22. Jun 2016, 11:25

Wenn man nur 2 Farben/1bit pro Pixel verwenden will, sollte man auch zu png oder gif greifen, da diese Formate diese Farbtiefe effektiv unterstützen. jpeg verfolgt einen ganz anderen Kompressionsansatz("Quantisierung").

1227 x 1758 px, 1bit Farbtiefe, png -> ca. 68kb

http://imgur.com/fGFznxM
But who would build the roads?

Zurück zu „430. Helpdesk“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast