PDA

Просмотр полной версии : Пожелания к программе


fat
07.04.2009, 02:01
После работы с программой составил список фич, которые по моему мнению надо обязательно включить в следующие версии MultiReader-а, а также несколько багов, которые желательно исправить.

1. Добавить возможность задания шаблона поиска заголовка. Не всегда заголовок расположен в тегах <title> или <h1>, <h2>, и т.д. Часто он находится в других тегах.

2. Исправить баг, при котором заголовки стоящие в тегах h1, h2, h3 и имеющие параметры (например, <h1 style="font-size: 20pt"></h1>) программой не находятся!

3. Исправить баг, при котором при зависании программы и некорректном выходе не сохраняется никакой информации, созданной и собранной во время последней сессии.
Например, я создал и настроил проект, запустил граббинг. Программа зависла. Я запускаю её заново и созданный ранее проект пропадает!
Конечно лучше не это исправить, а сделать так чтобы программа не зависала:)

4. Добавить проверку шаблонов поиска контента и заголовков, чтобы можно было не запуская полный граббинг убедиться в правильности написания регулярного выражения, к примеру.

5. Исправить баг, при котором программа зависает и выскакивает ошибка типа access violation при граббинге в режиме паука.

6. Добавить возможность задания нескольких диапазонов поиска страниц или что-то типа задания шаблона поиска страниц.
Не всегда достаточно добавить {xxx} в задании диапазонов, очень на многих сайтах присутствует пара диапазонов, например id новости и id категории. Приходится в таких случаях включать режим паука.

7. Сделать возможность задания шаблона имени файлов при экспорте в отдельные файлы. Не очень удобно, когда экспортируешь данные из нескольких проектов и все файлы имеют одинаковые имена в виде цифр.


В остальном программа очень понравилась своей простотой и быстрой скоростью работы.
Большое спасибо автору программы за хороший софт!:)

usman
08.04.2009, 10:43
Все сделаю. Дайте только время. :)

adv
14.04.2009, 13:18
Очень жду продвинутый шаблон для выбора заголовков, первых H1 и tittle не достаточно, в первом H1 или H2 не всегда содержится название статьи, может содержаться в десятом H1 или <div style="">, а в tittle много ненужной информации зачастую. Пока об универсальности рано говорить.
И как уже говорилось, прога пропускает первый <H1 со style="" или class=""

usman
02.07.2009, 15:30
Очень жду продвинутый шаблон для выбора заголовков, первых H1 и tittle не достаточно, в первом H1 или H2 не всегда содержится название статьи, может содержаться в десятом H1 или <div style=&quot;&quot;>, а в tittle много ненужной информации зачастую. Пока об универсальности рано говорить.
И как уже говорилось, прога пропускает первый <H1 со style=&quot;&quot; или class=&quot;&quot;

В новой версии этот баг поправлен. Осталось добавить только возможность указания номера тега от начала файла.