Daftar Isi
Tools and tips for converting data formats on the Debian system are described.
Standard based tools are in very good shape but support for proprietary data formats are limited.
Paket-paket berikut untuk konversi data teks menarik perhatian saya.
Tabel 11.1. Daftar alat konversi data teks
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
libc6
|
V:923, I:999 | 12878 | set karakter | text encoding converter between locales by iconv (1)
(fundamental) |
recode
|
V:3, I:23 | 603 | charset+eol | text encoding converter between locales (versatile, more aliases and features) |
konwert
|
V:1, I:52 | 134 | set karakter | text encoding converter between locales (fancy) |
nkf
|
V:0, I:10 | 362 | set karakter | penerjemah set karakter untuk bahasa Jepang |
tcs
|
V:0, I:0 | 518 | set karakter | penerjemah set karakter |
unaccent
|
V:0, I:0 | 35 | set karakter | mengganti huruf beraksen dengan ekuivalennya yang tidak berakses |
tofrodos
|
V:1, I:22 | 55 | eol | pengubah format teks antara DOS dan Unix: fromdos (1) dan
todos (1) |
macutils
|
V:0, I:0 | 312 | eol | pengubah format teks antara Macintosh dan Unix:
frommac (1) dan tomac (1) |
![]() |
Tip |
---|---|
|
Anda dapat mengonversi pengodean berkas teks dengan
iconv
(1) dengan yang berikut ini.
$ iconv -f encoding1 -t encoding2 input.txt >output.txt
Nilai pengodean tidak membedakan huruf besar kecil dan mengabaikan
"-
" dan "_
" untuk pencocokkan.
Pengodean yang didukung dapat diperiksa oleh perintah "iconv
-l
".
Tabel 11.2. Daftar nilai pengodean dan penggunaannya
nilai pengodean | pengunaan |
---|---|
ASCII | American Standard Code for Information Interchange, kode 7 bit tanpa karakter beraksen |
UTF-8 | standar multibahasa saat ini untuk semua OS modern |
ISO-8859-1 | standar lama untuk bahasa Eropa Barat, ASCII + karakter beraksen |
ISO-8859-2 | standar lama untuk bahasa Eropa Timur, karakter beraksen ASCII + |
ISO-8859-15 | standar lama untuk bahasa Eropa Barat, ISO-8859-1 dengan tanda euro |
CP850 | code page 850, karakter Microsoft DOS dengan grafis untuk bahasa Eropa Barat, varian ISO-8859-1 |
CP932 | code page 932, varian Shift-JIS gaya Microsoft Windows untuk bahasa Jepang |
CP936 | code page 936, varian GB2312, GBK, atau GB18030 gaya Microsoft Windows untuk bahasa Cina yang Disederhanakan |
CP949 | code page 949, varian EUC-KR atau Unified Hangul Code gaya Microsoft Windows untuk bahasa Korea |
CP950 | code page 950, varian Big5 gaya Microsoft Windows untuk bahasa Cina Tradisional |
CP1251 | code page 1251, pengodean gaya Microsoft Windows untuk alfabet Cyrillic |
CP1252 | code page 1252, varian ISO-8859-15 gaya Microsoft Windows untuk bahasa-bahasa Eropa Barat |
KOI8-R | Standar UNIX bahasa Rusia lama untuk alfabet Cyrillic |
ISO-2022-JP | pengodean standar untuk surel berbahasa Jepang yang hanya menggunakan kode 7 bit |
eucJP | kode 8 bit standar UNIX Jepang lama dan benar-benar berbeda dari Shift-JIS |
Shift-JIS | JIS X 0208 Lampiran 1 standar untuk bahasa Jepang (lihat CP932) |
![]() |
Catatan |
---|---|
Beberapa pengodean hanya didukung untuk konversi data dan tidak digunakan sebagai nilai lokal (Bagian 8.1, “Lokal”). |
Untuk set karakter yang masuk dalam byte tunggal seperti set karakter ASCII dan ISO-8859, pengodean karakter berarti hampir sama dengan set karakter.
Untuk set karakter dengan banyak karakter seperti JIS X 0213 untuk Jepang atau Universal Character Set (UCS, Unicode, ISO-10646-1) untuk hampir semua bahasa, ada banyak skema pengodean yang sesuai dengan mereka ke dalam urutan data byte.
EUC dan ISO/IEC 2022 (juga dikenal sebagai JIS X 0202) untuk bahasa Jepang
UTF-8, UTF-16/UCS-2, dan UTF-32/UCS-4 untuk Unicode
Untuk ini, ada diferensiasi yang jelas antara set karakter dan pengodean karakter.
Code page digunakan sebagai sinonim untuk tabel pengodean karakter untuk beberapa vendor tertentu.
![]() |
Catatan |
---|---|
Please note most encoding systems share the same code with ASCII for the 7
bit characters. But there are some exceptions. If you are converting old
Japanese C programs and URLs data from the casually-called shift-JIS
encoding format to UTF-8 format, use " |
![]() |
Tip |
---|---|
|
Anda dapat memeriksa apakah berkas teks dikodekan dalam UTF-8 dengan
iconv
(1) dengan yang berikut ini.
$ iconv -f utf8 -t utf8 input.txt >/dev/null || echo "non-UTF-8 found"
![]() |
Tip |
---|---|
Gunakan opsi " |
Berikut adalah contoh skrip untuk mengonversi pengkodean nama berkas dari yang dibuat di bawah OS lama ke UTF-8 modern dalam satu direktori.
#!/bin/sh ENCDN=iso-8859-1 for x in *; do mv "$x" "$(echo "$x" | iconv -f $ENCDN -t utf-8)" done
Variabel "$ENCDN
" menentukan pengodean asli yang
digunakan untuk nama berkas di bawah OS yang lebih tua seperti dalam Tabel 11.2, “Daftar nilai pengodean dan penggunaannya”.
Untuk kasus yang lebih rumit, silakan kait suatu sistem berkas (misalnya
partisi pada disk drive) yang berisi nama berkas tersebut dengan pengodean
yang tepat sebagai opsi mount
(8) (lihat Bagian 8.1.3, “Pengodean nama berkas”) dan menyalin seluruh isinya ke sistem berkas
lain yang dikait sebagai UTF-8 dengan perintah "cp -a
".
Format berkas teks, khususnya kode end-of-line (EOL/akhir baris), tergantung pada platform.
Tabel 11.3. Daftar gaya EOL untuk platform yang berbeda
platform | Kode EOL | kontrol | desimal | heksadesimal |
---|---|---|---|---|
Debian (unix) | LF | ^J |
10 | 0A |
MSDOS dan Windows | CR-LF | ^M^J |
13 10 | 0D 0A |
Apple Macintosh | CR | ^M |
13 | 0D |
The EOL format conversion programs, fromdos
(1),
todos
(1), frommac
(1), and
tomac
(1), are quite handy. recode
(1)
is also useful.
![]() |
Catatan |
---|---|
Some data on the Debian system, such as the wiki page data for the
|
![]() |
Catatan |
---|---|
Most editors (eg. |
![]() |
Tip |
---|---|
The use of " |
Ada beberapa program khusus yang populer untuk mengonversi kode-kode tab.
Tabel 11.4. List of TAB conversion commands from bsdmainutils
and
coreutils
packages
fungsi | bsdmainutils |
coreutils |
---|---|---|
mengekspansi tab ke spasi | "col -x " |
expand |
unexpand tab from spaces | "col -h " |
unexpand |
indent
(1) from the indent
package
completely reformats whitespaces in the C program.
Editor programs such as vim
and emacs
can be used for TAB conversion, too. For example with
vim
, you can expand TAB with ":set
expandtab
" and ":%retab
" command sequence. You
can revert this with ":set noexpandtab
" and
":%retab!
" command sequence.
Intelligent modern editors such as the vim
program are
quite smart and copes well with any encoding systems and any file formats.
You should use these editors under the UTF-8 locale in the UTF-8 capable
console for the best compatibility.
An old western European Unix text file, "u-file.txt
",
stored in the latin1 (iso-8859-1) encoding can be edited simply with
vim
by the following.
$ vim u-file.txt
This is possible since the auto detection mechanism of the file encoding in
vim
assumes the UTF-8 encoding first and, if it fails,
assumes it to be latin1.
An old Polish Unix text file, "pu-file.txt
", stored in
the latin2 (iso-8859-2) encoding can be edited with vim
by the following.
$ vim '+e ++enc=latin2 pu-file.txt'
An old Japanese unix text file, "ju-file.txt
", stored in
the eucJP encoding can be edited with vim
by the
following.
$ vim '+e ++enc=eucJP ju-file.txt'
An old Japanese MS-Windows text file, "jw-file.txt
",
stored in the so called shift-JIS encoding (more precisely: CP932) can be
edited with vim
by the following.
$ vim '+e ++enc=CP932 ++ff=dos jw-file.txt'
When a file is opened with "++enc
" and
"++ff
" options, ":w
" in the Vim
command line stores it in the original format and overwrite the original
file. You can also specify the saving format and the file name in the Vim
command line, e.g., ":w ++enc=utf8 new.txt
".
Please refer to the mbyte.txt "multi-byte text support" in
vim
on-line help and Tabel 11.2, “Daftar nilai pengodean dan penggunaannya” for locale values used with
"++enc
".
The emacs
family of programs can perform the equivalent
functions.
The following reads a web page into a text file. This is very useful when
copying configurations off the Web or applying basic Unix text tools such as
grep
(1) on the web page.
$ w3m -dump http://www.remote-site.com/help-info.html >textfile
Similarly, you can extract plain text data from other formats using the following.
Tabel 11.5. List of tools to extract plain text data
paket | popcon | ukuran | kata kunci | fungsi |
---|---|---|---|---|
w3m
|
V:25, I:221 | 2367 | html→teks | HTML to text converter with the "w3m -dump " command |
html2text
|
V:2, I:27 | 274 | html→teks | advanced HTML to text converter (ISO 8859-1) |
lynx
|
V:16, I:113 | 1949 | html→teks | Pengubah HTML ke teks dengan perintah "lynx -dump " |
elinks
|
V:5, I:25 | 1763 | html→teks | Pengubah HTML ke teks dengan perintah "elinks -dump " |
links
|
V:5, I:35 | 2286 | html→teks | Pengubah HTML ke teks dengan perintah "links -dump " |
links2
|
V:1, I:13 | 5459 | html→teks | Pengubah HTML ke teks dengan perintah "links2 -dump " |
catdoc
|
V:21, I:127 | 686 | MSWord→teks,TeX | mengonversi berkas MSWord menjadi teks polos atau TeX |
antiword
|
V:1, I:9 | 589 | MSWord→teks,ps | mengonversi berkas MSWord menjadi teks polos atau ps |
pstotext
|
V:0, I:2 | 126 | ps/pdf→teks | mengekstrak teks dari berkas PostScript dan PDF |
unhtml
|
V:0, I:0 | 43 | html→teks | remove the markup tags from an HTML file |
odt2txt
|
V:1, I:12 | 60 | odt→teks | konverter dari OpenDocument Text ke teks |
Anda dapat menyorot dan memformat data teks polos dengan berikut ini.
Tabel 11.6. Daftar alat untuk menyoroti data teks polos
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
vim-runtime
|
V:19, I:427 | 32763 | penyorotan | Vim MACRO to convert source code to HTML with ":source
$VIMRUNTIME/syntax/html.vim " |
cxref
|
V:0, I:0 | 1193 | c→html | pengubah bagi program C ke latex dan HTML (bahasa C) |
src2tex
|
V:0, I:0 | 622 | penyorotan | mengonversi banyak kode sumber ke TeX (bahasa C) |
source-highlight
|
V:0, I:7 | 1991 | penyorotan | mengonversi banyak kode sumber ke berkas HTML, XHTML, LaTeX, Texinfo, escape sequence warna ANSI, dan DocBook dengan penyorotan (C++) |
highlight
|
V:0, I:8 | 1079 | penyorotan | mengonversi banyak kode sumber ke berkas HTML, XHTML, RTF, LaTeX, TeX, atau XSL-FO dengan penyorotan (C++) |
grc
|
V:0, I:4 | 208 | teks→color | pewarna generik untuk semuanya (Python) |
pandoc
|
V:9, I:48 | 151715 | teks→apa pun | pengubah markup umum (Haskell) |
python3-docutils
|
V:14, I:47 | 1810 | teks→apa pun | Pemformat dokumen ReStructured Text ke XML (Python) |
markdown
|
V:0, I:10 | 57 | teks→html | Pemformat dokumen teks markdown ke (X)HTML (Perl) |
asciidoctor
|
V:0, I:8 | 99 | teks→apa pun | Pemformat dokumen teks AsciiDoc ke XML/HTML (Python) |
python3-sphinx
|
V:6, I:21 | 2763 | teks→apa pun | Sistem publikasi dokumen berbasis ReStructured Text (Python) |
hugo
|
V:0, I:4 | 48225 | teks→html | Sistem publikasi situs statis berbasis markdown (Go) |
Extensible Markup Language (XML) adalah bahasa markup untuk dokumen yang berisi informasi terstruktur.
Lihat informasi pengantar di XML.COM.
Teks XML terlihat agak mirip HTML. Ini
memungkinkan kita untuk mengelola beberapa format keluaran untuk dokumen.
Salah satu sistem XML yang mudah adalah paket
docbook-xsl
, yang digunakan di sini.
Setiap berkas XML dimulai dengan deklarasi XML standar sebagai berikut.
<?xml version="1.0" encoding="UTF-8"?>
Sintaks dasar untuk satu elemen XML ditandai sebagai berikut.
<name attribute="value">content</name>
Elemen XML dengan konten kosong ditandai dalam bentuk pendek berikut.
<name attribute="value" />
"attribute="nilai"
" dalam contoh di atas adalah opsional.
Bagian komentar dalam XML ditandai sebagai berikut.
<!-- comment -->
Selain menambahkan markup, XML memerlukan konversi kecil ke konten menggunakan entitas terpradefinisi untuk karakter-karakter berikut.
Tabel 11.7. Daftar entitas terpradefinisi untuk XML
entitas terpradefinisi | tujuan konversi karakter |
---|---|
" |
" : kutip |
' |
' : apostrof |
< |
< : kurang dari |
> |
>: : lebih dari |
& |
& : ampersand |
![]() |
Perhatian |
---|---|
" |
![]() |
Catatan |
---|---|
Ketika entitas tentuan pengguna gaya SGML, misalnya
" |
![]() |
Catatan |
---|---|
Selama markup XML dilakukan secara konsisten dengan set tertentu dari nama tag (baik beberapa data sebagai konten atau nilai atribut), konversi ke XML lain adalah tugas sepele menggunakan Extensible Stylesheet Language Transformations (XSLT). |
Ada banyak alat yang tersedia untuk memproses berkas XML seperti Extensible Stylesheet Language (XSL).
Pada dasarnya, setelah Anda membuat berkas XML yang terbentuk dengan baik, Anda dapat mengonversinya ke format apa pun menggunakan Extensible Stylesheet Language Transformations (XSLT).
Extensible Stylesheet
Language for Formatting Objects (XSL-FO) seharusnya menjadi solusi
untuk pemformatan. Paket fop
baru di arsip
main
Debian karena ketergantungannya pada bahasa pemrograman Java. Jadi kode
LaTeX biasanya dihasilkan dari XML menggunakan XSLT dan sistem LaTeX
digunakan untuk membuat berkas yang dapat dicetak seperti DVI, PostScript,
dan PDF.
Tabel 11.8. Daftar alat XML
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
docbook-xml
|
I:351 | 2134 | xml | Definisi tipe dokumen XML (DTD) untuk DocBook |
docbook-xsl
|
V:11, I:147 | 14870 | xml/xslt | Stylesheet XSL untuk memroses DocBook XML ke berbagai format keluaran dengan XSLT |
xsltproc
|
V:14, I:93 | 160 | xslt | Prosesor baris perintah XSLT (XML→ XML, HTML, teks polos, dll.) |
xmlto
|
V:1, I:20 | 130 | xml/xslt | Konverter XML-ke-apa-pun dengan XSLT |
fop
|
V:1, I:18 | 291 | xml/xsl-fo | mengonversi berkas XML Docbook ke PDF |
dblatex
|
V:3, I:14 | 4643 | xml/xslt | mengonversi berkas Docbook ke dokumen DVI, PostScript, PDF dengan XSLT |
dbtoepub
|
V:0, I:0 | 37 | xml/xslt | konverter DocBook XML ke .epub |
Karena XML adalah bagian dari Standard Generalized Markup Language (SGML), itu dapat diproses oleh alat yang banyak tersedia untuk SGML, seperti Document Style Semantics and Specification Language (DSSSL).
Tabel 11.9. Daftar alat DSSSL
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
openjade
|
V:2, I:34 | 1019 | dsssl | ISO /IEC 10179:1996 standar prosesor DSSSL (terbaru) |
docbook-dsssl
|
V:1, I:19 | 2605 | xml/dsssl | Stylesheet DSSSL untuk memroses DocBook XML ke berbagai format keluaran dengan DSSSL |
docbook-utils
|
V:0, I:14 | 287 | xml/dsssl | utilitas untuk berkas DocBook termasuk konversi ke format lain (HTML, RTF,
PS, man, PDF) dengan perintah docbook2* dengan DSSSL |
sgml2x
|
V:0, I:0 | 90 | SGML/dsssl | konverter dari SGML dan XML menggunakan stylesheet DSSSL |
Anda dapat mengekstrak data HTML atau XML dari format lain menggunakan berikut.
Tabel 11.10. Daftar alat ekstraksi data XML
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
man2html
|
V:0, I:2 | 138 | manpage→html | konverter dari manpage ke HTML (dukungan CGI) |
doclifter
|
V:0, I:0 | 451 | troff→xml | konverter dari troff ke DocBook XML |
texi2html
|
V:0, I:7 | 1833 | texi→html | konverter dari Texinfo ke HTML |
info2www
|
V:1, I:2 | 76 | info→html | konverter dari info GNU ke HTML (dukungan CGI) |
wv
|
V:0, I:6 | 717 | MSWord→apapun | konverter dokumen dari Microsoft Word ke HTML, LaTeX, dll. |
unrtf
|
V:0, I:4 | 148 | rtf→html | konverter dokumen dari RTF ke HTML, dll |
ooo2dbk
|
V:0, I:0 | 217 | sxw→xml | konverter dari dokumen SXW OpenOffice.org ke DocBook XML |
wp2x
|
V:0, I:0 | 202 | WordPerfect→apapun | berkas WordPerfect 5.0 dan 5.1 ke TeX, LaTeX, troff, GML, dan HTML |
Untuk berkas HTML non-XML, Anda dapat mengonversinya ke XHTML yang merupakan contoh XML yang terbentuk dengan baik. XHTML dapat diproses dengan alat XML.
Sintaks berkas XML dan kebaikan URL yang ditemukan di dalamnya dapat diperiksa.
Tabel 11.11. Daftar alat cetak cantik XML
paket | popcon | ukuran | fungsi | deskripsi |
---|---|---|---|---|
libxml2-utils
|
V:20, I:224 | 186 | xml↔html↔xhtml | alat XML baris perintah dengan xmllint (1) (pemeriksaan
sintaks, memformat ulang, lint, …) |
tidy
|
V:1, I:12 | 84 | xml↔html↔xhtml | Pemeriksa sintaks dan pemformat ulang HTML |
weblint-perl
|
V:0, I:1 | 32 | lint | sintaks dan pemeriksa gaya minimal untuk HTML |
linklint
|
V:0, I:0 | 344 | pemeriksaan tautan | fast link checker and web site maintenance tool |
Once proper XML is generated, you can use XSLT technology to extract data based on the mark-up context etc.
The Unix troff program originally developed by AT&T can be used for simple typesetting. It is usually used to create manpages.
TeX created by Donald Knuth is a very powerful type setting tool and is the de facto standard. LaTeX originally written by Leslie Lamport enables a high-level access to the power of TeX.
Secara tradisional, roff adalah sistem
pemrosesan teks Unix utama. Lihat roff
(7),
groff
(7), groff
(1),
grotty
(1), troff
(1),
groff_mdoc
(7), groff_man
(7),
groff_ms
(7), groff_me
(7),
groff_mm
(7), dan "info groff
".
Anda dapat membaca atau mencetak tutorial dan referensi yang bagus tentang
"-me
" makro di
"/usr/share/doc/groff/
" dengan memasang paket
groff
.
![]() |
Tip |
---|---|
" |
![]() |
Tip |
---|---|
Untuk menghapus "^H" dan "_" dari berkas teks yang dihasilkan oleh
|
Distribusi perangkat lunak TeX Live
menawarkan sistem TeX yang lengkap. Metapackage texlive
menyediakan pilihan yang layak dari paket TeX
Live yang seharusnya cukup untuk tugas yang paling umum.
Ada banyak referensi yang tersedia untuk TeX dan LaTeX.
tex
(1)
latex
(1)
texdoc
(1)
texdoctk
(1)
"The TeXbook", by Donald E. Knuth, (Addison-Wesley)
"LaTeX - A Document Preparation System", by Leslie Lamport, (Addison-Wesley)
"The LaTeX Companion", by Goossens, Mittelbach, Samarin, (Addison-Wesley)
This is the most powerful typesetting environment. Many SGML processors use this as their back end text
processor. Lyx provided by the
lyx
package and GNU
TeXmacs provided by the texmacs
package offer
nice WYSIWYG editing environment for LaTeX while many use Emacs and Vim as the choice
for the source editor.
There are many online resources available.
The TEX Live Guide - TEX Live 2007
("/usr/share/doc/texlive-doc-base/english/texlive-en/live.html
")
(texlive-doc-base
package)
When documents become bigger, sometimes TeX may cause errors. You must
increase pool size in "/etc/texmf/texmf.cnf
" (or more
appropriately edit "/etc/texmf/texmf.d/95NonPath
" and run
update-texmf
(8)) to fix this.
![]() |
Catatan |
---|---|
The TeX source of "The TeXbook" is available at http://tug.ctan.org/tex-archive/systems/knuth/dist/tex/texbook.tex.
This file contains most of the required macros. I heard that you can
process this document with |
You can print a manual page in PostScript nicely by one of the following commands.
$ man -Tps some_manpage | lpr
Although writing a manual page (manpage) in the plain troff format is possible, there are few helper packages to create it.
Tabel 11.13. List of packages to help creating the manpage
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
docbook-to-man
|
V:0, I:11 | 191 | SGML→manpage | converter from DocBook SGML into roff man macros |
help2man
|
V:0, I:9 | 509 | text→manpage | automatic manpage generator from --help |
info2man
|
V:0, I:0 | 135 | info→manpage | konverter dari info GNU ke halaman POD atau man |
txt2man
|
V:0, I:1 | 114 | text→manpage | mengonversi teks ASCII datar ke format halaman man |
Printable data is expressed in the PostScript format on the Debian system. Common Unix Printing System (CUPS) uses Ghostscript as its rasterizer backend program for non-PostScript printers.
The core of printable data manipulation is the Ghostscript PostScript (PS) interpreter which generates raster image.
Tabel 11.14. Daftar penerjemah PostScript Ghostscript
paket | popcon | ukuran | deskripsi |
---|---|---|---|
ghostscript
|
V:202, I:531 | 234 | The GPL Ghostscript PostScript/PDF interpreter |
ghostscript-x
|
V:8, I:60 | 226 | GPL Ghostscript PostScript/PDF interpreter - X display support |
libpoppler102
|
V:147, I:277 | 4274 | PDF rendering library forked from the xpdf PDF viewer |
libpoppler-glib8
|
V:254, I:478 | 445 | PDF rendering library (GLib-based shared library) |
poppler-data
|
V:112, I:620 | 13089 | CMaps for PDF rendering library (for CJK support: Adobe-*) |
![]() |
Tip |
---|---|
" |
You can merge two PostScript (PS) or
Portable Document Format
(PDF) files using gs
(1) of Ghostscript.
$ gs -q -dNOPAUSE -dBATCH -sDEVICE=pswrite -sOutputFile=bla.ps -f foo1.ps foo2.ps $ gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=bla.pdf -f foo1.pdf foo2.pdf
![]() |
Catatan |
---|---|
The PDF, which is a widely used cross-platform printable data format, is essentially the compressed PS format with few additional features and extensions. |
![]() |
Tip |
---|---|
For command line, |
The following packages for the printable data utilities caught my eyes.
Tabel 11.15. Daftar utilitas data yang dapat dicetak
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
poppler-utils
|
V:195, I:367 | 689 | pdf→ps,teks,… | PDF utilities: pdftops , pdfinfo ,
pdfimages , pdftotext ,
pdffonts |
psutils
|
V:6, I:91 | 219 | ps→ps | alat konversi dokumen PostScript |
poster
|
V:0, I:4 | 58 | ps→ps | membuat poster besar dari halaman PostScript |
enscript
|
V:1, I:18 | 2132 | text→ps, html, rtf | mengonversi teks ASCII ke PostScript, HTML, RTF, atau Pretty-Print |
a2ps
|
V:1, I:14 | 3648 | text→ps | 'Anything to PostScript' converter and pretty-printer |
pdftk
|
I:49 | 28 | pdf→pdf | alat konversi dokumen PDF: pdftk |
html2ps
|
V:0, I:3 | 261 | html→ps | konverter dari HTML ke PostScript |
gnuhtml2latex
|
V:0, I:1 | 27 | html→latex | konverter dari html ke latex |
latex2rtf
|
V:0, I:5 | 480 | latex→rtf | mengonversi dokumen dari LaTeX ke RTF yang dapat dibaca oleh MS Word |
ps2eps
|
V:3, I:56 | 99 | ps→eps | konverter dari PostScript ke EPS (Encapsulated PostScript) |
e2ps
|
V:0, I:0 | 109 | text→ps | konverter Teks ke PostScript dengan dukungan pengodean Jepang |
impose+
|
V:0, I:0 | 119 | ps→ps | utilitas PostScript |
trueprint
|
V:0, I:0 | 146 | text→ps | pretty print many source codes (C, C++, Java, Pascal, Perl, Pike, Sh, and Verilog) to PostScript. (C language) |
pdf2svg
|
V:0, I:4 | 30 | ps→svg | converter from PDF to Scalable vector graphics format |
pdftoipe
|
V:0, I:0 | 70 | ps→ipe | konverter dari PDF ke format XML IPE |
Both lp
(1) and lpr
(1) commands offered
by Common Unix Printing System
(CUPS) provides options for customized printing the printable data.
You can print 3 copies of a file collated using one of the following commands.
$ lp -n 3 -o Collate=True filename
$ lpr -#3 -o Collate=True filename
You can further customize printer operation by using printer option such as
"-o number-up=2
", "-o page-set=even
",
"-o page-set=odd
", "-o scaling=200
",
"-o natural-scaling=200
", etc., documented at Command-Line Printing and
Options.
The following packages for the mail data conversion caught my eyes.
Tabel 11.16. Daftar paket untuk membantu konversi data surel
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
sharutils
|
V:3, I:47 | 1421 | shar (1), unshar (1),
uuencode (1), uudecode (1) |
|
mpack
|
V:1, I:16 | 107 | MIME | encoding and decoding of MIME messages:
mpack (1) and munpack (1) |
tnef
|
V:1, I:9 | 110 | ms-tnef | unpacking MIME attachments of type "application/ms-tnef" which is a Microsoft only format |
uudeview
|
V:0, I:4 | 109 | enkoder dan dekoder untuk format berikut: uuencode, xxencode, BASE64, quoted printable, dan BinHex |
![]() |
Tip |
---|---|
The Internet Message Access Protocol version 4 (IMAP4) server may be used to move mails out from proprietary mail systems if the mail client software can be configured to use IMAP4 server too. |
Mail (SMTP) data should be limited to series of 7 bit data. So binary data and 8 bit text data are encoded into 7 bit format with the Multipurpose Internet Mail Extensions (MIME) and the selection of the charset (see Tabel 11.2, “Daftar nilai pengodean dan penggunaannya”).
The standard mail storage format is mbox formatted according to RFC2822 (updated RFC822). See
mbox
(5) (provided by the mutt
package).
For European languages, "Content-Transfer-Encoding:
quoted-printable
" with the ISO-8859-1 charset is usually used for
mail since there are not much 8 bit characters. If European text is encoded
in UTF-8, "Content-Transfer-Encoding: quoted-printable
"
is likely to be used since it is mostly 7 bit data.
For Japanese, traditionally "Content-Type: text/plain;
charset=ISO-2022-JP
" is usually used for mail to keep text in 7
bits. But older Microsoft systems may send mail data in Shift-JIS without
proper declaration. If Japanese text is encoded in UTF-8, Base64 is likely to be used since it contains many 8
bit data. The situation of other Asian languages is similar.
![]() |
Catatan |
---|---|
If your non-Unix mail data is accessible by a non-Debian client software which can talk to the IMAP4 server, you may be able to move them out by running your own IMAP4 server. |
![]() |
Catatan |
---|---|
If you use other mail storage formats, moving them to mbox format is the
good first step. The versatile client program such as
|
You can split mailbox contents to each message using
procmail
(1) and formail
(1).
Each mail message can be unpacked using munpack
(1) from
the mpack
package (or other specialized tools) to obtain
the MIME encoded contents.
The following packages for the graphic data conversion, editing, and organization tools caught my eyes.
Tabel 11.17. Daftar alat data grafis
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
gimp
|
V:61, I:300 | 19827 | gambar(bitmap) | GNU Image Manipulation Program |
imagemagick
|
I:353 | 221 | gambar(bitmap) | program manipulasi gambar |
graphicsmagick
|
V:2, I:15 | 5306 | gambar(bitmap) | program manipulasi citra (fork dari imagemagick ) |
xsane
|
V:16, I:161 | 2346 | gambar(bitmap) | GTK-based X11 frontend for SANE (Scanner Access Now Easy) |
netpbm
|
V:28, I:363 | 5056 | gambar(bitmap) | alat konversi grafis |
icoutils
|
V:12, I:82 | 221 | png↔ico(bitmap) | convert MS Windows icons and cursors to and from PNG formats (favicon.ico) |
scribus
|
V:2, I:22 | 30523 | ps/pdf/SVG/… | Penyunting DTP Scribus |
libreoffice-draw
|
V:119, I:427 | 13442 | gambar(vector) | LibreOffice office suite - drawing |
inkscape
|
V:35, I:167 | 87324 | gambar(vector) | Penyunting SVG (Scalable Vector Graphics) |
dia
|
V:3, I:28 | 3620 | gambar(vector) | penyunting diagram (Gtk) |
xfig
|
V:1, I:14 | 6334 | gambar(vector) | Facility for Interactive Generation of figures under X11 |
pstoedit
|
V:3, I:76 | 1003 | ps/pdf→gambar(vector) | Konverter berkas PostScript dan PDF ke grafis vektor yang dapat disunting (SVG) |
libwmf-bin
|
V:8, I:176 | 180 | Windows/gambar(vector) | Alat konversi metafile Windows (data grafik vektor) |
fig2sxd
|
V:0, I:0 | 149 | fig→sxd(vector) | mengonversi berkas XFig ke format OpenOffice.org Draw |
unpaper
|
V:2, I:19 | 460 | gambar→gambar | alat pasca-pemrosesan bagi halaman yang dipindai untuk OCR |
tesseract-ocr
|
V:8, I:36 | 1507 | gambar→text | perangkat lunak OCR bebas berdasarkan mesin OCR komersial HP |
tesseract-ocr-eng
|
V:6, I:37 | 4032 | gambar→text | Data mesin OCR: berkas bahasa tesseract-ocr untuk teks bahasa Inggris |
gocr
|
V:1, I:10 | 531 | gambar→text | perangkat lunak OCR bebas |
ocrad
|
V:0, I:4 | 318 | gambar→text | perangkat lunak OCR bebas |
eog
|
V:64, I:269 | 7640 | gambar(Exif) | Program penampil grafis Eye of GNOME |
gthumb
|
V:4, I:20 | 5318 | gambar(Exif) | penampil dan peramban citra (GNOME) |
geeqie
|
V:5, I:18 | 15785 | gambar(Exif) | penampil citra menggunakan GTK |
shotwell
|
V:17, I:237 | 6402 | gambar(Exif) | pengorganisasi foto digital (GNOME) |
gtkam
|
V:0, I:5 | 1154 | gambar(Exif) | aplikasi untuk mengambil media dari kamera digital (GTK) |
gphoto2
|
V:0, I:11 | 955 | gambar(Exif) | Klien baris perintah kamera digital gphoto2 |
gwenview
|
V:27, I:94 | 11042 | gambar(Exif) | penampil citra (KDE) |
kamera
|
I:94 | 854 | gambar(Exif) | dukungan kamera digital untuk aplikasi KDE |
digikam
|
V:2, I:12 | 2921 | gambar(Exif) | aplikasi manajemen foto digital untuk KDE |
exiv2
|
V:2, I:36 | 305 | gambar(Exif) | alat manipulasi metadata EXIF/IPTC |
exiftran
|
V:1, I:18 | 70 | gambar(Exif) | mentransformasi citra jpeg kamera digital |
jhead
|
V:0, I:10 | 131 | gambar(Exif) | memanipulasi bagian non-gambar dari berkas JPEG patuh Exif (foto kamera digital) |
exif
|
V:1, I:16 | 339 | gambar(Exif) | utilitas baris perintah untuk menampilkan informasi EXIF dalam berkas JPEG |
exiftags
|
V:0, I:4 | 292 | gambar(Exif) | utility to read Exif tags from a digital camera JPEG file |
exifprobe
|
V:0, I:4 | 499 | gambar(Exif) | membaca metadata dari gambar digital |
dcraw
|
V:2, I:16 | 562 | gambar(Raw)→ppm | decode raw digital camera images |
findimagedupes
|
V:0, I:1 | 82 | image→fingerprint | menemukan gambar yang serupa secara visual atau duplikat |
ale
|
V:0, I:0 | 839 | gambar→gambar | menggabung gambar untuk meningkatkan mutu atau membuat mosaik |
imageindex
|
V:0, I:2 | 145 | gambar(Exif)→html | menghasilkan galeri HTML statis dari gambar |
outguess
|
V:0, I:2 | 231 | jpeg,png | alat Steganografi universal |
librecad
|
V:2, I:16 | 8309 | DXF | Penyunting data CAD (KDE) |
blender
|
V:3, I:36 | 85549 | blend, TIFF, VRML, … | Penyunting konten 3D untuk animasi dll |
mm3d
|
V:0, I:0 | 3868 | ms3d, obj, dxf, … | Penyunting model 3D berbasis OpenGL |
open-font-design-toolkit
|
I:0 | 10 | ttf, ps, … | metapackage untuk desain fonta terbuka |
fontforge
|
V:0, I:7 | 4191 | ttf, ps, … | penyunting fonta untuk fonta PS, TrueType, dan OpenType |
xgridfit
|
V:0, I:0 | 806 | ttf | program for gridfitting and hinting TrueType fonts |
![]() |
Tip |
---|---|
Cari lebih banyak alat gambar menggunakan regex
" |
Although GUI programs such as gimp
(1) are very powerful,
command line tools such as imagemagick
(1) are quite
useful for automating image manipulation via scripts.
The de facto image file format of the digital camera is the Exchangeable Image File Format (EXIF) which is the JPEG image file format with additional metadata tags. It can hold information such as date, time, and camera settings.
The Lempel-Ziv-Welch (LZW) lossless data compression patent has been expired. Graphics Interchange Format (GIF) utilities which use the LZW compression method are now freely available on the Debian system.
![]() |
Tip |
---|---|
Any digital camera or scanner with removable recording media works with Linux through USB storage readers since it follows the Design rule for Camera Filesystem and uses FAT filesystem. See Bagian 10.1.7, “Perangkat penyimpanan lepasan”. |
Ada banyak program lain untuk mengonversi data. Paket-paket berikut menarik
perhatian saya menggunakan regex "~Guse::converting
"
dalam aptitude
(8) (lihat Bagian 2.2.6, “Opsi metode pencarian dengan aptitude”).
Tabel 11.18. Daftar alat konversi data lain-lain
paket | popcon | ukuran | kata kunci | deskripsi |
---|---|---|---|---|
alien
|
V:2, I:27 | 163 | rpm/tgz→deb | converter for the foreign package into the Debian package |
freepwing
|
V:0, I:0 | 421 | EB→EPWING | converter from "Electric Book" (popular in Japan) to a single JIS X 4081 format (a subset of the EPWING V1) |
calibre
|
V:9, I:33 | 57919 | any→EPUB | konverter e-book dan manajemen perpustakaan |
You can also extract data from RPM format with the following.
$ rpm2cpio file.src.rpm | cpio --extract