Re: systemd

To: debian-russian@lists.debian.org
Subject: Re: systemd
From: Victor Wagner <vitus@wagner.pp.ru>
Date: Fri, 13 Nov 2015 17:03:35 +0300
Message-id: <[🔎] 20151113170335.06a5cddf@fafnir>
In-reply-to: <[🔎] CAMRqRqzPHK+oKU82=TLU05k1PDun7wqurkXuex49Cu9GyOib3A@mail.gmail.com>
References: <[🔎] 20151112084456.GC9499@vdsl.uvw.ru> <[🔎] 1447347322.1363.0@smtp.mail.ru> <[🔎] 20151113093658.GP17764@protva.ru> <[🔎] CAMRqRqxDzs-TzB8KPVA0L=vWcP3-5Q5P85G7S93ZUDTQNK+Erw@mail.gmail.com> <[🔎] 20151113104818.GR17764@protva.ru> <[🔎] 5645C9A7.1060205@ya.ru> <[🔎] 20151113150306.0c8def65@fafnir> <[🔎] CAMRqRqzPHK+oKU82=TLU05k1PDun7wqurkXuex49Cu9GyOib3A@mail.gmail.com>

On Fri, 13 Nov 2015 15:33:57 +0300
Max Dmitrichenko <dmitrmax@gmail.com> wrote:

> > Кстати, между прочим, бинарное представление XML/SGML в виде DOM с
> > которым работают браузеры, форматтеры и xslt-преобразователи
> > занимает обычно в 10 раз больше места, чем текстовый формат в utf-8.
> 
> Возьмите JSON, если хочется компактности. Проблема в том, что:

В сериализованной форме у sgml/xml вполне нормальная компактность.
Конечно, если использовать имена тегов на полстрочки, как в DocBook или
xsl-foo, то чуть похуже, если как в html-е старательно выбирать для
самых частых тегов самые короткие (вплоть д о однобуквенноых
<p>,<b>,<i>) имена - чуть получше

Но по сравнению с DOM-структурой в памяти это копейки. JSON нам
потребуется распарсить в примерно такую же иерархическую структуру  с
указателями, что и XML. И эта структура тоже будет на порядок больше,
чем сериализованное представление. 

И в общем даже ASN.1 DER encoding нам много выигрыша по сравнению с xml
нам не даст. Ну в два раза, ну в три, но не на порядки.

> XML/SGML/JSON данные имеют структуру, причем не фиксированную, и
> доступную для обработки любым универсальным (и уже написанным)
> парсером соотв. формата, а текстовый формат конкретной програмулины
> надо парсить специфичной именно для этого формата программой, каждый
> раз изобретая велосипед.

Зачем каждый раз изобретать велосипеед? Существует уйма уже написаных
генераторов парсеров, вроде yacc/bison, которые превращают формальное
описание входного языка в работающий парсер. Или можно взять любой
более-менее гибкий язык программирования - Lisp/Scheme, Tcl, Lua, и
сделать на его основе DSL, воспользовавшись его готовым парсером.

Собственно парсинг XML-я это даже не парсер, это аналог лексера в
LALR(1) грамматиках. Парсинг  в смысле yacc-а начинается когда мы
начинаем проверять логическую структуру дерева. То есть в XML это
валидация схемы. Про которую часто забывают.

Reply to:

References:
- Re: systemd
  - From: "Dmitry E. Oboukhov" <unera@debian.org>
- Re: systemd
  - From: Alexey Shrub <worldmind@mail.ru>
- Re: systemd
  - From: Eugene Berdnikov <bd4@protva.ru>
- Re: systemd
  - From: Max Dmitrichenko <dmitrmax@gmail.com>
- Re: systemd
  - From: Eugene Berdnikov <bd4@protva.ru>
- Re: systemd
  - From: Илья <mirspo@ya.ru>
- Re: systemd
  - From: Victor Wagner <vitus@wagner.pp.ru>
- Re: systemd
  - From: Max Dmitrichenko <dmitrmax@gmail.com>

Prev by Date: Re: systemd
Next by Date: Re: systemd
Previous by thread: Re: systemd
Next by thread: Re: systemd
Index(es):
- Date
- Thread