Unicode ??? Topic is solved

Stelle Fragen zur Programmierung mit Autohotkey

Moderator: jNizM

BoBo
Posts: 6564
Joined: 13 May 2014, 17:15

Unicode ???

23 Aug 2017, 11:36

Hi,
wenn ich folgenden code ausführe um den (aus einer datei geparsten) html sourcecode zu konvertieren, erhalte ich folgenden text ...
Gätjens großes Kino was natürlich "Gätjens großes Kino" heißen sollte.

Übersehe ich eine bereits vorhandene funktion(alität), bzw wie wäre der COM-Aufruf anzupassen damit die konvertierung fehlerfrei funktioniert ?
Ich nutze die aktuelle AHK version.

Gruß
BoBo

Code: Select all

html =     <title lang="de">Gätjens großes Kino</title>

MsgBox % ComUnHTML(html)

ComUnHTML(html) {					; https://autohotkey.com/board/topic/47356-unhtm-remove-html-formatting-from-a-string-updated/page-2 - by 'Guest'
	oHTML := ComObjCreate("HtmlFile")
	oHTML.write(html)
	return % oHTML.documentElement.innerText
	}

wolf_II
Posts: 2688
Joined: 08 Feb 2015, 20:55

Re: Unicode ???

23 Aug 2017, 11:52

Kann ich reproduzieren wenn ich den code nicht mit UTF-8 abspeichere.
Mit UTF-8 encoded script geht's aber wie gewünscht.
User avatar
nnnik
Posts: 4500
Joined: 30 Sep 2013, 01:01
Location: Germany

Re: Unicode ???

23 Aug 2017, 11:55

Bei mir funktioniert dein Beispiel fehlerfrei, was entweder auf einen Bug in deinem Windows oder dem Fileeinlesen hindeutet.
Recommends AHK Studio
User avatar
jeeswg
Posts: 6902
Joined: 19 Dec 2016, 01:58
Location: UK

Re: Unicode ???  Topic is solved

23 Aug 2017, 12:57

Das könnte nützlich sein:
Parsing XML Document Resulting In Random Special Characters - AutoHotkey Community
https://autohotkey.com/boards/viewtopic ... 90#p161190

Oder:

Code: Select all

FileRead, vText, % "*P65001 " vPath ;read as UTF-8
Prost.
homepage | tutorials | wish list | fun threads | donate
WARNING: copy your posts/messages before hitting Submit as you may lose them due to CAPTCHA
BoBo
Posts: 6564
Joined: 13 May 2014, 17:15

Re: Unicode ???

23 Aug 2017, 16:19

jeeswg wrote:Das könnte nützlich sein:
Parsing XML Document Resulting In Random Special Characters - AutoHotkey Community
https://autohotkey.com/boards/viewtopic ... 90#p161190

Oder:

Code: Select all

FileRead, vText, % "*P65001 " vPath ;read as UTF-8
Prost.
"Prost" did the trick :thumbup:
BoBo
Posts: 6564
Joined: 13 May 2014, 17:15

Re: Unicode ???

23 Aug 2017, 16:24

nnnik wrote:Bei mir funktioniert dein Beispiel fehlerfrei, was entweder auf einen Bug in deinem Windows oder dem Fileeinlesen hindeutet.
Vorgeschaltet war ein download via URLDownloadToFile + FileRead. Tatsächlich hat der codepage parameter von FileRead das problem gelöst.
Danke an alle :mrgreen:
just me
Posts: 9487
Joined: 02 Oct 2013, 08:51
Location: Germany

Re: Unicode ???

24 Aug 2017, 01:41

Im Zweifel sollte sich im Header der HTML-Datei ein charset oder encoding Tag finden lassen -> Angabe der Zeichencodierung in HTML

Return to “Ich brauche Hilfe”

Who is online

Users browsing this forum: WPLPHSS and 33 guests