ICONV -Befehl unter Linux

ICONV -Befehl unter Linux
Stellen Sie sicher. Verwenden Sie für das Update das Dienstprogramm „APT“ von Linux mit dem Schlüsselwort "Aktualisieren" und führen Sie diese Anweisung mit den Berechtigungen "sudo" aus. Obwohl wir jetzt zur Implementierung springen können, würden wir es vorziehen, dieses System auch zu aktualisieren, ich.e., Ein Upgrade würde die Wahrscheinlichkeit des Auftretens von Fehlern verringern, und das System könnte die Probleme genauer lösen. Verwenden Sie daher das Dienstprogramm „APT“ in der Anweisung "Upgrade".

Schauen wir uns jetzt den Iconv -Nutzen von Linux in seiner Terminalkonsole an. Wir haben also den Befehl "iconv" mit dem Flag „-l“ ausgeführt, um alle bekannten und am häufigsten verwendeten codierten Zeichensätze auf unserem Terminalbildschirm anzuzeigen. Es werden die codierten Zeichensätze zusammen mit ihren Aliase angezeigt. Sie können eine lange Liste codierter Zeichensätze sehen, nachdem Sie etwas nach unten gescrollt haben.

Jetzt ist es Zeit, mit der Implementierung des ICONV -Befehls in Linux zu beginnen. Erstens benötigen wir verschiedene Dateienarten in unserem System, um einen Dateiart in einen anderen Typ umzuwandeln. So verwenden wir die Abfrage „Touch“ am Konsolenterminal, um drei verschiedene Dateien zu erstellen.e., Java -Typ, C -Typ und Texttyp. Wenn Sie den aktuellen Verzeichnisgehalt auflisten, finden Sie die neu generierten Dateien darin.

Danach werden wir den Typ jeder Datei separat anhand der Abfrage „Datei“ zusammen mit dem Namen jeder Datei ansehen. Diese Abfrage benötigt die Option "-i", um den Typ des Codierungszeichens für jede Datei separat anzuzeigen. Wenn Sie vergessen haben, die Option "-i" zu verwenden, verwenden Sie stattdessen das Flag "-mime". Sowohl die Flags "-i" und "-mime" funktionieren gleich.

Nachdem wir nun die Anweisung "Datei" für die Datei "txt" -Typ ausgeführt haben. Während der Verwendung der gleichen Anweisung für die Java- und C -Dateien zeigt es, dass beide Dateien "binäre" Zeichenkodierung enthalten. Zusammen mit diesem zeigt diese Anweisung, dass all diese drei Dateien leer sind.

Jetzt veranschaulichen wir die Verwendung der Iconv -Anweisung an der Konsole, um eine bestimmte Zeichenkodierungsdatei mit einer bestimmten Zeichensatzkodierung in eine andere Zeichenkodierung zu konvertieren. Vorher müssen wir unseren Dateien Code oder Daten hinzufügen. Daher haben wir den Java -Code in den Text hinzugefügt.Java ”-Datei, C -Code im Text„ Text.C ”-Datei und hinzugefügte Textdaten in den Test„ Test.txt ”Datei. Die Katzenabfrage wurde hier verwendet, um den Inhalt aller drei Dateien anzuzeigen, wie unten dargestellt:

Nachdem wir die Daten erfolgreich hinzugefügt haben, werden wir die Charakter -Set -Codierung dieser Dateien erneut sehen. Wir haben also dieselbe Dateianweisung in der Shell mit dem Flag „-i“ und den Dateinamen ausprobiert, ich.e., prüfen.txt, test.Java und Test.C. Das Ausführen dieser drei Anweisungen für alle drei Dateien zeigt, dass die Charakter -Set -Codierung für die Java- und C -Dateien aktualisiert wurde und gleichzeitig für die Textdatei gleich bleibt.e., US-Ascii. Die Codierung von Java- und C -Dateien war zuvor „binär“; Jetzt ist es "US-Ascii". Darüber hinaus wird angezeigt, dass die Textdatei Klartextdaten enthält, während die beiden anderen Codedateien die Skripte als Inhalt enthalten.

Es ist Zeit, die tatsächliche Aufgabe auszuführen, die für diesen Artikel benötigt wird, ich.e., Konvertieren Sie eine Codierung in die andere mit dem Befehl iconv in der Shell. Daher haben wir die Anweisung „Iconv“ innerhalb des Shell -Terminals mit den "sudo" -Regilegien verwendet. Dieser Befehl übernimmt die Option "-f" für "From", und die Option "-t" steht für "to", i, ich.e., von einer Kodierung zum anderen.

Nach der Option "-f" müssen Sie die Codierung Ihrer Datei bereits angeben, ich.e., US-Ascii. Während nach der Option "-t" müssen Sie die Codierung angeben, die Sie durch die alte Codierung ersetzen möchten, ich.e., Unicode. Sie müssen den Namen einer Datei angeben, die als Quelle mit der Option -o verwendet wird, um das Objektbild zu erstellen. Das Objektbild wäre eine andere Datei, ich.e., "neu.c ”vom gleichen Typ, jedoch mit der neuen Codierung und den gleichen Daten.

Nachdem Sie die folgende Anweisung ausgeführt haben, erhalten Sie eine neue Datei im selben Verzeichnis, ich.e., Gemäß der "LS" -Anfrage. Jetzt werden wir nach der Charakter -Set -Codierung einer neuen Datei prüfen, die mit der Iconv -Anweisung generiert wurde. Wir werden die Anweisung "Datei" erneut mit der Option "-i" und dem neuen Dateinamen verwenden, i.e., neu.C.

Sie werden sehen, dass der Zeichen für diese neue Datei sich von dem Zeichensatz einer alten Datei unterscheidet, i.e., Das UTF-16LE-Zeichensatz. Dies liegt daran.c Datei. Die Abfrage „Cat“ zeigte den gleichen C -Code in der Datei an, begann jedoch mit einigen Unicode -Zeichen, wie bereits angegeben.

In sehr ähnlicher Weise werden wir die Codierung des Tests ändern.TXT -Textdatei. Die Dateianweisung zeigt, dass sie eine Codierung des US-ACTII-Zeichenssatzes enthält. Der Befehl iconv wurde mit demselben Format verwendet, um die Codierung des Tests zu konvertieren.TXT-Datei von US-Ascii bis türkisch8. Sie werden sehen, dass es die US-Ascii nicht in Türkisch ändert.

Danach verwendeten wir denselben Befehl, um US-ASCII mit UTF-32-Zeichen-Codierung für dieselbe Datei abzudecken. Diesmal funktioniert es. Dies liegt daran.

Abschluss

In diesem Artikel wurde erörtert. Auf diese Weise mussten wir einige Dateien verschiedener Typen erstellen.