Телеграмм чат группы modernperl страница 7703

Мне её нужно найти
Что-то вроде fire/fuel - один символ
Я так понимаю, что ничего быстрее посимвольного сравнения слева направо не может быть, разве что сравнивать не по 1 байту, например, а по 4. И явно такую логику можно сделать очень быстрой на Си, но не на perl

источник

19:45пожаловаться #10

Andrey Konovalov in Modern::Perl

Если сравнивать по 4 байта - делать xor и смотреть, где первый установленный в 1 бит, для чего в обычном Intel Asm'е есть инструкции прямо.

источник

19:45пожаловаться #11

Andrey Konovalov in Modern::Perl

Тут ещё определённый косяк в том, что сравнивать нужно строго ASCII, не UTF (но XS-ка это небось итак бы учла и заюзала бы разные алгоритмы для строк, где только ASCII и остальных).

источник

19:46пожаловаться #12

Andrey Konovalov in Modern::Perl

https://metacpan.org/pod/String::LCSS_XS

metacpan.org

String::LCSS_XS

Find The Longest Common Substring of Two Strings.

источник

19:50пожаловаться #13

Andrey Konovalov in Modern::Perl

Нет, не нашёль: оно ищет какие-то крутые штуки типа просто общих подстрок, где бы они ни были

источник

19:52пожаловаться #14

Anton Petrusevich in Modern::Perl

Andrey Konovalov

на счёт быстрого не обещаю, бенчмаркать надо:

$ perl -E '$a="abcdefghijkl"; $b="abcdef01234"; $c = $a ^ $b; say $-[0] if $c =~ m{([^\0])};'
6

источник

20:21пожаловаться #15

Andrey Konovalov in Modern::Perl

Anton Petrusevich

на счёт быстрого не обещаю, бенчмаркать надо:

$ perl -E '$a="abcdefghijkl"; $b="abcdef01234"; $c = $a ^ $b; say $-[0] if $c =~ m{([^\0])};'
6

sub __lcp {
    return undef unless @_;
    my $i = 0;
    use bytes;
    my ($L, $R) = ( length($_[0]), length($_[1]) );
    my $max_l = $L > $R ? $R : $L;
    for (; $i < $max_l; $i++) {
        ord(substr $_[0], $i, 1) == ord(substr $_[1], $i, 1) or last
    }
    no bytes;
    $i
}

источник

20:24пожаловаться #16

Andrey Konovalov in Modern::Perl

Цикл конечно жесть, если так на мильон символов - всё время потратим тупо на интерпретацию "байт-кода" perl

источник

20:26пожаловаться #17

Sergey Zhmylove in Modern::Perl

Andrey Konovalov

sub __lcp {
    return undef unless @_;
    my $i = 0;
    use bytes;
    my ($L, $R) = ( length($_[0]), length($_[1]) );
    my $max_l = $L > $R ? $R : $L;
    for (; $i < $max_l; $i++) {
        ord(substr $_[0], $i, 1) == ord(substr $_[1], $i, 1) or last
    }
    no bytes;
    $i
}

Щьо за трэш? И это производительный код?? Ффууу

источник

20:52пожаловаться #18

Anton Petrusevich in Modern::Perl

Andrey Konovalov

Цикл конечно жесть, если так на мильон символов - всё время потратим тупо на интерпретацию "байт-кода" perl

забенчмаркай

источник

21:07пожаловаться #19

Anton Petrusevich in Modern::Perl

а то так можно и сплитом строки на массивы разбить...

источник

21:08пожаловаться #20