Як легко перетворювати формати документів у Linux

Як легко перетворювати формати документів у Linux

Однією з часто згаданих проблем з переходом на Linux є сумісність файлів. Ви будете незмінно надсилати користувачам файли інших операційних систем, і вони не виглядатимуть однаково при відкритті в таких програмах, як Word. Хоча ви можете встановити шрифти або спробувати віртуальні машини або емулятори, щоб переконатися, що все виглядає однаково, інший підхід - виконати свою роботу в текстовому форматі, а потім перетворити її після того, як ви закінчите.


Розблокуйте БЕЗКОШТОВНИЙ Чит-лист Markdown прямо зараз!

Це підпише вас на нашу розсилку

Введіть адресу електронної пошти

[] [] [] [] розблокування

Прочитайте нашу політику конфіденційності

Одним з інструментів, які ви можете використовувати для перетворення між форматами, є pandoc, необхідний інструмент у наборі інструментів будь-якого користувача Linux.

Базове встановлення і використання Pandoc

Встановлення pandoc у більшості дистрибутивів Linux - це проста поїздка в репозиторії. У системах на основі Ubuntu наступна команда встановить його для вас:

sudo apt-get install pandoc

Після встановлення ви можете почати використовувати командний рядок для перетворення файлів. Відмінно справляється з Markdown та іншими легкими мовами розмітки, якщо у вас є файл .MD, ви можете перетворити його на HTML за допомогою наступного:

pandoc -o myfile.html myfile.md

Прапор -o вказує назву вихідного файла, який ви хочете. У цьому випадку він також виводить формат виводу (HTML) за суфіксом назви файла. Ви можете використовувати прапорці -r (для читання) і -w (для запису), щоб повідомити pandoc тип конверсії, який ви хочете. Припустимо, ви звикли писати в Markdown, але вам потрібно щось опублікувати на сторінці на MediaWiki:

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md

У своїх більш ранніх версіях pandoc фокусувався на «оновленні» файлів, в тому сенсі, що він міг конвертувати більш прості формати (такі як Markdown) в більш складні (наприклад, ODT або Microsoft DOCX). Але тепер він буде читати і ці більш складні формати. Це означає, що якщо ви звикли до текстового процесора, але спокушені всіма причинами використовувати менший і більш портативний текстовий формат стало набагато простіше.

З огляду на каталог, повний файлів Word, наступна команда перетворює кожен з них на Markdown:

for file in * do pandoc -r docx -w markdown -o ""$file"".md ""$file"" done

Зауважте, що у результаті у вас залишаться файли з назвою filename.docx.md, тому вам потрібно буде виконати команду швидкого перейменування (або, що ще краще, додати її до описаного вище як сценарій оболонки.) .

Параметри командного рядка Pandoc

Тепер, коли у вас є деякі основи, ми розглянемо деякі більш просунуті параметри параметрів командного рядка pandoc.

Довідкові файли ODT/DOCX

Припустимо, ви перетворили всі свої старі, громіздкі файли текстового процесора на Markdown. Поки ви насолоджуєтеся радістю від написання простого тексту, в якийсь момент вам потрібно буде поділитися цим з кимось. І цей хтось може бути не так освічений, як ви. Ви можете просто змінити прапорці читання і запису, щоб перетворити файл назад на формат Word:

pandoc -r markdown -w docx -o wordfile.docx wordfile.md

Але деяким людям подобаються їхні файли Word з певними шрифтами, пронумерованими заголовками і т. д. Бекенд Pandoc DOCX підтримує файли шаблонів, звані посилальними файлами, якраз для такого випадку. Це файли ODT або DOCX, які ви налаштували з усім потрібним стилем. Потім pandoc застосовує ці стилі під час перетворення, якщо ви передаєте йому посилальний файл у командному рядку:

pandoc -r markdown -w odt --reference-odt=/home/user/path/to/ref-file.odt -o lowriter.odt lowriter.md

Зауважте, як шрифти, налаштовані у файлі довідки вище (Arial Black для заголовка 1 тощо) Відображаються у перетвореному файлі нижче. Ви можете створити стільки еталонних файлів, скільки вам потрібно (наприклад, один для кожного клієнта). Потім повністю ігноруйте форматування під час написання та застосовуйте стилі за один крок під час конвертації.

Бекенд візуалізації PDF

Створення PDF-файлів також є простою вправою після встановлення необхідних пакетів. Полегшений спосіб отримати можливість запису у форматі PDF - встановити пакет wkhtmltopdf, інструмент командного рядка для перетворення HTML на PDF. Pandoc спочатку підтримує це, тому, якщо ви встановите прапор запису в HTML, а вихідний файл - у форматі PDF, він буде інтерпретувати це як ваш намір використовувати wkhtmltopdf сам по собі!

pandoc -r markdown -w html -o nicepub.pdf nicepub.md

Як альтернативу, ви можете обрати повнофункціональний варіант за допомогою системи набору тексту TeTex. Скористайтеся тим фактом, що ці пакунки є рекомендованими для встановлення пакунка pandoc, перевстановивши їх за допомогою наступної команди:

sudo apt-get install --install-suggests pandoc

Потім відкиньтеся на спинку крісла, поки багато (насправді, багато) пакетів встановлюються. Як тільки вони будуть завершені, ви можете перетворити ваш файл безпосередньо в PDF, вказавши його як прапор запису:

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md

Хоча для параметра wkhtmltopdf потрібно встановити лише один пакунок, ви можете отримати більш зручні для друку результати з TeTex. А саме, шрифти із засічками використовуються за замовчуванням, а сторінки автоматично нумеруються.

Генератор електронних книг

Нарешті, pandoc може конвертувати ваші файли в електронні книги, що підходять для читання на телефоні або в електронному ридері. Сервери epub і epub3 дадуть вам правильно відформатовану електронну книгу:

pandoc -r markdown -w epub -o mybook.epub mybook.md

Додаткові поради

Переваги pandoc виходять за рамки його можливостей як утиліти командного рядка... наприклад, вона включає підтримку поліпшеної версії Markdown і може бути легко інтегрована з графічними програмами.

Уценка Пандока

Крім того, що pandoc є інструментом конвертації, він підтримує трохи поліпшену версію Markdown. Використовуючи pandoc замість стандартної команди markdown, ви отримуєте деякі додаткові функції, включаючи такі:

  • Метадані - варіант Markdown, розроблений Pandoc, дозволяє включати в заголовок документа такі відомості, як автор, дата, адреса електронної пошти тощо.
  • Декорації тексту - Ви можете застосовувати декорації тексту, такі як закреслення або супер/підписка, які не підтримуються в стандартній Markdown через pandoc.
  • Таблиці - тільки це робить pandoc вартісним порівняно з «ванільною» уцінкою. Використовуючи символ конвеєра для розділення комірок таблиці, ви можете створити таблицю, яка варіюється від дійсно потворної до зручної як у звичайному тексті, так і у візуалізованому форматі.
  • Незвичайні списки - Pandoc дозволяє форматувати списки з рівнями стилю контура, наприклад, «1»., потім «A»., потім «i». І т. д. Ви також можете вказати початковий номер для списків, де списки відображаються у вигляді простої розмітки. почати з «1»
  • Підсвічування синтаксису коду - Ви можете застосувати підсвічування до ваших блоків коду, повідомивши pandoc, якою мовою ви говорите.

Вище наведено лише деякі функції Pandoc Markdown. Відвідайте сторінку підручника з pandoc.org для отримання повного списку додаткових можливостей Markdown.

Використовуйте графічний інтерфейс з Pandoc

Хоча pandoc ефективний як інструмент командного рядка, він містить багато параметрів. Якщо ви новачок у Linux, ви можете використовувати pandoc з графічним інтерфейсом. Хоча за замовчуванням він не містить графічного інтерфейсу, ви можете встановити PanDocElectrion для перетворення ваших документів за допомогою простого клацання. Завантажте скрипт встановлення з веб-сайту програми, потім запустіть його, щоб встановити всі необхідні пакети і саму програму.

Після встановлення команда npm start у каталозі PanDocElectron запустить програму. За допомогою спадних списків форматів і можливості вибору вхідного файлу за допомогою діалогового вікна, це допоможе вам звикнути до «входів і виходів» pandoc.

Якщо ви знайомі з безліччю параметрів і прапорів pandoc, але просто хочете, щоб він легко викликався, ви можете інтегрувати його з текстовим редактором GUI. Наприклад, редактор Atom містить декілька пакунків, які дозволяють зберегти поточний файл у різних форматах за допомогою pandoc (пакунок pandoc-convert):

Інший варіант - запускати команди pandoc, використовуючи вбудовані функції редактора, такі як команда build. Пакунок інструментів збирання Atom дає вам можливість задавати команди користувача:

Потім ви можете викликати команду build для ваших файлів, сумісних з pandoc, так само, як і для вихідного коду:

Пандок знімає стрес від перемикання

З pandoc у вашому наборі ви можете бути спокійні, знаючи, що ви завжди можете передати свої документи іншим людям у потрібному їм форматі. У той же час ви можете скористатися деякими з чудових можливостей Linux (подумайте про те, щоб спробувати один з текстових редакторів на основі терміналу, наприклад, vim).

Ви часто перетворите файли назад і вперед між форматами? Якщо ви зіткнулися з проблемами сумісності, повідомте нам про це в коментарях, і ми подивимося, чи зможемо ми використовувати pandoc, щоб розібратися з вами!

Image