Size: a a a

2019 December 04

AK

Andrey Konovalov in Modern::Perl
Andrey Konovalov
Блин, это URI же. На сам XML стандартов вообще что ли нет?
https://www.w3.org/TR/xml/
Вроде оно. Непонятно только, в какой он системе стандартов находится.
источник

c

crux in Modern::Perl
Andrey Konovalov
https://www.w3.org/TR/xml/
Вроде оно. Непонятно только, в какой он системе стандартов находится.
Я ж раза три уже его линковал.

W3C publishes documents that define Web technologies. These documents follow a process designed to promote consensus, fairness, public accountability, and quality. At the end of this process, W3C publishes Recommendations, which are considered Web standards.
источник

AK

Andrey Konovalov in Modern::Perl
Да, нашёл, система так и называется "W3C Recommendations". Thanks!
источник

С

С in Modern::Perl
Как много нового выяснилось с такого казалось бы простого задания
источник

SK

Stanislav Kvasnikov in Modern::Perl
Andrey Konovalov
Нет, в том-то и дело. У fb2 есть схема - и все вопросы сразу отпадают.
и она была в тестовом, надо было внимательно смотреть
источник

AK

Andrey Konovalov in Modern::Perl
С
Как много нового выяснилось с такого казалось бы простого задания
Но в спецификации XML 1.1 нет никаких отсылок ни к href, ни к id="something"
По крайней мере я пробежал по оглавлению, посмотрел поиском - ничего похожего на описание дефолтных правил связности внутри документа для любого XML я не нашёл. Плохо искал? :(
источник

AK

Andrey Konovalov in Modern::Perl
Тут же нет ничего о том, что это будет за файл.
Другое дело, что можно в заголовке XML вычитать, какой схеме соответствует данный файл, но... писать тестовое задание для потенциально любой схемы - это очень круто, я не знаю универсального решения такой задачи.
источник

AK

Andrey Konovalov in Modern::Perl
Напишите скрипт, получающий в качестве параметра путь к XML-файлу и выдающий
на STDOut следующее:
Суммарное число букв внутри тегов, не включая пробельные символы (<aaa
dd="ddd">text</aaa> - четыре буквы)
Суммарное число букв нормализованного текста внутри тегов, включая и пробелы
Число внутренних ссылок (теги <a href="#id">)
Число битых внутренних ссылок (ссылки на несуществующие ID элементов)
источник

AK

Andrey Konovalov in Modern::Perl
Кстати, не уверен, что схема fb2 позволяет странные теги <aaa>
источник

AK

Andrey Konovalov in Modern::Perl
Andrey Konovalov
Тут же нет ничего о том, что это будет за файл.
Другое дело, что можно в заголовке XML вычитать, какой схеме соответствует данный файл, но... писать тестовое задание для потенциально любой схемы - это очень круто, я не знаю универсального решения такой задачи.
Да, и само описание задачи противоречит логически тому, что схема может быть любой. Думаю, не трудно найти схему, в которой нельзя использовать тег <a>. Наверняка есть и такие, в которых не предусмотрен атрибут href в теге <a>.
источник

В

Вертолетчик in Modern::Perl
Я это тестовое задание сделал неправильно, причём НАМЕРЕННО. Точнее не то, чтобы совсем неправильно, просто по смыслу некорректно. Там две картинки внизу зашиты в base64. Так вот эти символы считать не надо. Во всяком случае в этом нет смысла. Но один хрен прокатило )))
источник

AK

Andrey Konovalov in Modern::Perl
Вертолетчик
Я это тестовое задание сделал неправильно, причём НАМЕРЕННО. Точнее не то, чтобы совсем неправильно, просто по смыслу некорректно. Там две картинки внизу зашиты в base64. Так вот эти символы считать не надо. Во всяком случае в этом нет смысла. Но один хрен прокатило )))
В соотв. со схемой можно сказать, что данный тип атрибута "содержит в себе" (это же контейнер) только данные определённого типа. Если нет указания на то, что там бинарные данные, упакованные в base64 - значит, это просто текст и считать его надо ИМХО.
источник

В

Вертолетчик in Modern::Perl
Andrey Konovalov
В соотв. со схемой можно сказать, что данный тип атрибута "содержит в себе" (это же контейнер) только данные определённого типа. Если нет указания на то, что там бинарные данные, упакованные в base64 - значит, это просто текст и считать его надо ИМХО.
Окей, итс ап ту Ю
источник

AK

Andrey Konovalov in Modern::Perl
Вертолетчик
Окей, итс ап ту Ю
Я просто к тому, что, опять же, не зная, что там в атрибутах лежит, мы можем думать об этом вообще всё, что угодно. Это может быть шифрограмма, может быть химическая формула, может быть и текст на человеческом языке. Тем не менее, я не сомневаюсь в том, что и бинарные данные могут случайно содержать в себе корректно записанное в UTF-8 слово "Вася". Но от этого бинарные данные не утрачивают резко свой смысл и не превращаются магическим образом в текст.
источник

В

Вертолетчик in Modern::Perl
Andrey Konovalov
Я просто к тому, что, опять же, не зная, что там в атрибутах лежит, мы можем думать об этом вообще всё, что угодно. Это может быть шифрограмма, может быть химическая формула, может быть и текст на человеческом языке. Тем не менее, я не сомневаюсь в том, что и бинарные данные могут случайно содержать в себе корректно записанное в UTF-8 слово "Вася". Но от этого бинарные данные не утрачивают резко свой смысл и не превращаются магическим образом в текст.
Вот и покажи им УРОВЕНЬ! )))
источник

AK

Andrey Konovalov in Modern::Perl
Вертолетчик
Вот и покажи им УРОВЕНЬ! )))
Я его найти не могу уже вторую неделю, он мне самому нужен крюки на стену повесить :)
источник

AK

Andrey Konovalov in Modern::Perl
Гм, а вот про full normalization в XML не знал. И хотя в задании нет упоминания именно этого термина, есть только нормализация, можно догадаться, что наверное о full normalization'е из стандарта W3C идёт речь. Посыпаю голову пеплом и отползаю в угол :(
источник

В

Вертолетчик in Modern::Perl
Задание сложное для тех, кто думает, что оно сложное
источник

AK

Andrey Konovalov in Modern::Perl
[Definition: Text is fully-normalized if:]

the text is in a Unicode encoding form, is include-normalized and none of the relevant constructs comprising the text begin with a composing character or a character escape representing a composing character; or

the text is in a legacy encoding and, if it were transcoded to a Unicode encoding form by a normalizing transcoder, the resulting text would satisfy clause 1 above.

Жесть-то какая. Но вон @nuclight её выполнил
источник

В

Вертолетчик in Modern::Perl
full normalization тут не причём, нормализуй как хочешь. Четыре варианта у тебя есть. Делай как голова подсказывает
источник