HackerNews сегодня повторил уже
мелькавшую новость о том, что по крайне мере до 2011 года в реализации функции
wordexp()
в библиотеке libc Apple использовался Perl, как внешняя программа, производящая
разбор аргументов и собирающая их в строку с разделителем нуль-символом \0
:
char *cmd = "/usr/bin/perl -e 'print join(chr(0), @ARGV), chr(0)' -- ";
Оригинальный исходный код можно увидеть
здесь.
Комментарии
Карл Уильямсон работает над реализацией выражения \b{...}
, как расширенного
варианта \b
для задания типа границ в регулярных выражениях.
В Perl 5.22 появятся три варианта таких конструкций:
\b{gcb}
— граница кластера графемы (кластер графемы, это две или более
кодовых точек образующих один символ, например g̈
, состоящий из латинской
g
и знака двух точек)
\b{cb}
— граница предложений. Будет срабатывать там, где по правилам
Юникода происходит разделение предложений. Правда предложение Mr. Jones
всё равно будет считаться двумя предложениями.
\b{wb}
— граница слова.
Кроме того Юникод определяет и перенос строки и его можно реализовать как
\b{lb}
, но на CPAN уже есть
Unicode::LineBreak.
Простое выражение \b
определяет границу между символами \w
и \W
. Хотя
большинство новичков почему-то считают, что это граница между \s
и \S
. Есть
мысль реализовать такое как \b{space}
, но на самом деле скорее всего имеется
ввиду \b{wb}
, который действительно хорошо ищет границы для естественных
языков, например, он правильно выделит слово don't
в предложении ... don't.
,
включив апостроф, но исключив точку.
В этой связи Карл предлагает задать новый флаг для прагмы re
use re "/w"
который бы по умолчанию рассматривал обычный \b
как \b{wb}
в своей области
определения.
Комментарии
На проходившей в Бельгии конференции FOSDEM 2015 один из докладов делал Рикардо
Сигнес — ответственный за релизы стабильных версий Perl (pumpkin). Доклад был
посвящён процессу подготовки релизов Perl и, в частности, грядущему стабильному
релизу 5.22. Тацухико Миягаве удалось взять интервью, в ходе которого и
обсуждалась тема доклада.
Запись интервью на английском языке доступна на сайте
подкаста. Далее кратко о чём же беседовали два известных Perl-хакера.
Комментарии
Дальше →