Вход | Регистрация


Быстро ХМЛ-и сравнить. Как?

Быстро ХМЛ-и сравнить. Как?
Я
   bolobol
 
06.06.18 - 12:06
День добрый!

Как быстро сравнить пару ХМЛ-ей по 80 МБ ?
Известно что в эих ХМЛ-ях одни и те же объекты записаны, может различаться в них порядок строк, записей, наборов записей, но суть одна.

Есть мысль - свернуть по количеству символов и сравнить результат.

Два вопроса: Взлетит? Как это взлетать?
 
 
   piter3
 
1 - 06.06.18 - 12:07
total commander
   Cool_Profi
 
2 - 06.06.18 - 12:07
   Buster007
 
3 - 06.06.18 - 12:08
а результатом сравнения что должно быть?
   Базис
 
4 - 06.06.18 - 12:10
Не взлетит, только выгрузить в excel, отсортировать и тогда уже сравнивать.
   RomaH
 
5 - 06.06.18 - 12:12
(0) быстро не нашел способа
только одинаковая сортировка
т.е. оба надо в какой-нибудь студии отсортировать и сохранить еще раз
потом сравнивать
   b_ru
 
6 - 06.06.18 - 12:13
>>Есть мысль - свернуть по количеству символов и сравнить результат.

Дата=12.05.2018 и Дата=21.05.2018 свернутся одинаково, но смысл будут иметь разный.

Нужно парсить, строить дерево, каким-то образом сортировать узлы и сравнивать.
   bolobol
 
7 - 06.06.18 - 12:17
(6) Отлично!, спасибо! Учтём.
   Базис
 
8 - 06.06.18 - 12:17
Если быстро на полное совпадение, то контрольную сумму средствами ОС или fc/b filename1 filename2 >> (путь к темпу)log.txt и смотреть размер этого лога.
   bolobol
 
9 - 06.06.18 - 12:24
(2) Пример кода скачать можно, а ссылка на саму программулину там есть? Не нашёл.
   bolobol
 
10 - 06.06.18 - 12:25
(8) Быстрое полное совпадение - это "="
Зачем ещё контрольная сумма?
 
 Рекламное место пустует
   Вафель
 
11 - 06.06.18 - 12:25
нужен просто результат равно/не равно или еще и где не равно?
   Адинэснег
 
12 - 06.06.18 - 12:33
я в notepad++ юзаю плагин Compare
Alt+D
   RomaH
 
13 - 06.06.18 - 12:33
(11) нужно где не равно
вот тут, например:

https://www.dropbox.com/s/3hycwc98dp4nhmk/2018-06-06_12h32_35.png?dl=0

каждый раз выкладывают НСИ с новой сортировкой
   RomaH
 
14 - 06.06.18 - 12:36
(2) боюсь оно 80 метров не сожрет
   craxx
 
15 - 06.06.18 - 12:44
(0)MD5-хэш вычислить. Самое быстрое
   bolobol
 
16 - 06.06.18 - 13:14
(15) Хеш не сможет определить идентичность. Только точное сравнение +/- на погрешности хеша, что вообще не походит.
   bolobol
 
17 - 06.06.18 - 13:16
По-ходу, не буду лениться, по тега роу, филтер, рекорд пройдусь заменой - в остатке - либо сложится, либо нет.
   bolobol
 
18 - 06.06.18 - 13:16
(12) (13) Здесь не понял, чем оно в 1С сможет помочь?

Список тем форума
Рекламное место пустует  Рекламное место пустует
ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку "Обновить" в браузере.
Рекламное место пустует