То есть это должна быть контрольная сумма, по которой можно что-то сказать о первоисточнике. Причём самим источником оперировать нельзя/накладно.
Наверное какой-то каталог файлов, в котором ты пытаешься придумать новые способы хранения и доступа к информации. И видимо некие параметры этих файлов напрямую зависят от их размера.
Или какая-то ещё информация, имеющая в параметрах величину, равномерно изменяющуюся. Однозначно сложно сказать.
Адалт видео, которое нужно чётко сортировать по длительности? Каталог обоев, и нужно картинки различать по разрешению? Парсишь видео со streaming сервисов?
Очень близок к равномерному алгоритм вычисления хэш-функции (ГОСТ Р 34.11-94). Лабу делал. 256-битный алгоритм. Побитовое расстояние между соседними комбинациями в 128 бит. Как-то делал реализацию на C++. Довольно быстрый алгоритм.
Дело в том что хэш функция двух сообщений с разницей в один бит имеет хеммингово расстояние ровно в половину своей длины. Поэтому о схожести текстов по хэшу говорить не приходится.
Внимание! Все ссылки проходят фейс контроль. Все ссылки REL=NOFOLLOW. Удаляются все комментарии, кроме: анонимных или с ссылками на личные финансовые блоги.
Курсовая по теории вероятностей! :D
ОтветитьУдалитьСудя по времени и вопросу, у тебя бессонница:)
ОтветитьУдалитьЧо то у тя с криптографией связано, имхо теория информации ест твой моск
ОтветитьУдалитьТо есть это должна быть контрольная сумма, по которой можно что-то сказать о первоисточнике. Причём самим источником оперировать нельзя/накладно.
ОтветитьУдалитьНаверное какой-то каталог файлов, в котором ты пытаешься придумать новые способы хранения и доступа к информации. И видимо некие параметры этих файлов напрямую зависят от их размера.
Или какая-то ещё информация, имеющая в параметрах величину, равномерно изменяющуюся. Однозначно сложно сказать.
Адалт видео, которое нужно чётко сортировать по длительности? Каталог обоев, и нужно картинки различать по разрешению? Парсишь видео со streaming сервисов?
Очень близок к равномерному алгоритм вычисления хэш-функции (ГОСТ Р 34.11-94). Лабу делал. 256-битный алгоритм. Побитовое расстояние между соседними комбинациями в 128 бит. Как-то делал реализацию на C++. Довольно быстрый алгоритм.
ОтветитьУдалитьпоисковик ;)схожесть текста можно идентифицировать по "сумме" |=)
ОтветитьУдалитьДело в том что хэш функция двух сообщений с разницей в один бит имеет хеммингово расстояние ровно в половину своей длины. Поэтому о схожести текстов по хэшу говорить не приходится.
ОтветитьУдалить