Реклама

Настроить

Любовь и благодарность

Мар. 18, 2009

04:01 pm - Поважні депутати

Цікавий факт з життя Парламенту:
в цьому скликанні є 17 народних депутатів, яким в 2009-му виповнюється 70 та більше років (усі чоловіки):

Білорус Олег Григорович 14.10.1939 (БЮТ)
Богуслаєв Вячеслав Олександрович 28.10.1938 (ПР)
Дейч Борис Давидович 23.08.1938 (ПР)
Звягільський Юхим Леонідович 20.02.1933 (ПР)
Зубець Михайло Васильович 07.04.1938 (ПР)
Константинов Євген Семенович 02.05.1937 (БЮТ)
Корж Віталій Терентійович 16.08.1938 (БЮТ)
Косів Михайло Васильович 28.11.1934 (БЮТ)
Мармазов Євген Васильович 14.06.1938 (КПУ)
Мовчан Павло Михайлович 15.07.1939 (БЮТ)
Омельченко Олександр Олександрович 09.08.1938 (НУНС)
Поляченко Володимир Аврумович 14.08.1938 (НУНС)
Радовець Арнольд Анатолійович 30.11.1937 (БЮТ)
Сідельник Іван Іванович 18.06.1939 (БЮТ)
Сподаренко Іван Васильович 23.01.1931 (НУНС)
Ткаченко Олександр Миколайович 07.03.1939 (КПУ)
Федорчук Ярослав Петрович 22.10.1936 (БЮТ)

По фракціям:

БЮТ - 8
ПР - 4
НУНС - 3
КПУ - 2

2. Почитай отца твоего и мать, это первая заповедь с обетованием:
3. да будет тебе благо, и будешь долголетен на земле.
К Ефесянам 6:2-3

Tags:
(3 комментария | Оставить комментарий)

Авг. 1, 2008

09:11 am - Методы и алгоритмы

Собираю различные методы работы со строками, хочу сделать библиотеку под Delphi. Если есть что-то интересное, особенно связанное с украинским языком, сообщайте, пожалуйста в комментариях.

На выходных купил книжку "Методы и алгоритмы вычислений на строках", сейчас изучаю. Оказывается математика тоже интересна. =)

Если увижу, то куплю еще "Алгоритмы: введение в разработку и анализ".

Дополнено: Уже купил... =)

Tags:
(3 комментария | Оставить комментарий)

Июл. 31, 2008

12:05 pm - Компьютерная обработка текстов

Самая заманчивая и сложная, но частично выполнимая,  в ИТ область, как мне кажется,  - это КОТ (см. заголовок).

Кроме того, что нужно определить язык текста, для каждого языка нужно иметь необходимый минимум справочников и алгоритмов.

Во первых - это алфавиты, их сортировка, гласные, согласные, знаки препинания и т.д.

Во-вторых - это словари для морфологии (проверка орфографии и различные формы) и поиск в них.

В-третих - это семантический и синтаксический разбор, алгоритмы и справочники:

а) определение тематики текста, построение лексически-статистической характеристики (получение часто используемых фраз и выражений),
б) для разбора частей речи и построения семантической модели - словари форм, разные тезаурусы и частотные списки синонимов, антонимов, и.т.д. (с настроенными по каждой теме весовыми коэффициентами).
б) алгоритмы поиска и преобразования:
 - дат и времени (промежутков, периодов, проверка корректности, календари праздников и выходных дней, эпохи, эры, современная история и доисторические времена, слишком большие и слишком малые величины),
- чисел (все множество чисел, алгоритмы перевода из прописи в число и обратно),
- формул (математических, физических, химических, поддержка законов природы, периодическая таблица элементов, физические константы, построение графиков и написание формул),
- кодов (числовых, например почтовых индексов, ников, имен переменных => разбор программного кода, поддержка распространенных языков программирования),
- цветов (перевод слов в значения и обратно),
- собственных имен (словари имен, фамилий, прозвищ),
- географических названий (отсюда и местоположения), а также поиск адресов, карты и списки локаций,
- составление кратких аннотаций к тексту (сниппеты).

В-четвертых - это машинный перевод, синтез речи и анализ изображений (OCR).

Но у нас в Украине пока мало из перечисленного доступно и интегрировано в одних руках...

Tags: ,
(12 комментариев | Оставить комментарий)

09:04 am - Обратная сторона работы программистом

Часто уходя с работы уношу работу с собой. Сегодня ночью нашел "баг" - ;приснился код, который надо исправить. Проснулся, взвесил - так и есть, правильно. Но заснул, и на утро уже ничего не вспомнил. =( А еще был случай, ночью практически новую программу написал. Под утро устал, как после рабочего дня, а результатов - увы нету... Зато, когда в молодости на старой работе в наказание меня программиста заставляли выполнять работу наборщика текстов, то уходил в 18 с абсолютно чистой головой. Пришлось и там написать программу для автоматической обработки документов (таблиц), с помощью которой за 2 часа можно было выполнить обычную дневную норму. =)

Tags: ,
(6 комментариев | Оставить комментарий)

Июн. 5, 2008

01:51 pm - Мысли

1) Легко обижать людей, которые не могут ответить...
2) Имеющий власть и не использующий ее во благо - великий грешник.

Tags:
(7 комментариев | Оставить комментарий)

Дек. 28, 2007

09:39 am - Итоги работы за 2007 год

Наверное пора сделать обзорный выпуск того, что успел (и не совсем) за проходящий 2007 год (см. обзор за 2006). Итак, не буду распыляться на мелочу, а сразу по существу - только крупные законченные проекты:

1) Установка новых серверов для zakon.rada.gov.ua и zakon1.rada.gov.ua для базы данных "Законодавство України"
2) Увеличение мощности (почти в 3 раза) дало возможность использовать новые алгоритмы преобразования старого текста в новый.
3) Улучшение качества поиска за счет использования Google, Yandex, META и других внешних поисковых механизмов в альтернативном поиске.

Мелкие проекты (вкратце) тоже приятные - это установка статистики гугла, оптимизация, переделка проверки орфографии Orphus и многое другое.

Не закончено, но пройдено где-то 80%, подготовка к выкачке новых текстов в формате xml, с таблицам и картинками, глобальная переделка сайта для регистрации пользователей, балансировки, работы с персональными списками.

О неприятных моментах говорить не буду, дабы не омрачать приближающиеся праздники! =)

Tags: ,
(6 комментариев | Оставить комментарий)

Дек. 4, 2006

03:35 pm - Небольшие изменения на сайте "Законодавство України"

По причине болезни, я не мог вести блог. А вот работать приходится не смотря на болезни. =) Время движется, всё меняется, в том числе и на моём сайте.

Последние "фишки" - это изменения в RSS ленте. Теперь их стало две: "Найновіші надходження" и "Популярні документи". В последнем списке содержится статистика самых запрашиваемых и просматриваемых документов. Примечание: поскольку у меня несколько серверов, между которыми происходит балансировка нагрузки, то статистика временно разделена. Второй сервер zakon1.rada.gov.ua имеет свой список популярных документов...

Расскажу (по секрету), что вскоре будет изменён дизайн альтернативного контекстного поиска на МЕТА. Новый дизайн должен стать более удобным, легким и практичным. На главной странице будет полезная информация (указанные списки документов), а сама поисковая форма будет перенесена вверх, чтобы результаты поиска занимали больше места.

Теперь, как бы подводя итоги прошедшего года, перечислю существенные нововведения, внедренные мной:

1) Сотрудничество с МЕТА дало отличный для пользователей сервис с существенно лучшим, чем мой контекстным поиском. Хотя, если честно, у МЕТА есть небольшие проблемы: сервис частенько притормаживает, не отвечает, а раньше надолго вис. Поэтому мне пришлось написать робота, тестирующего доступность сервиса и динамически отключать его в случае неработы. Кроме того, внимательными пользователями найден глюк, когда просмотреть результаты можно только до 100 страницы, а 101 и т.д. - возвращается к 1.

2) Сайт Верховной Рады появился на "Карте Интернет". Кстати говоря, на пиксельную картинку я потратил почти 6 часов своего личного нерабочего времени. Оно того стоило? =)

3) Полностью переработан механизм сайта, в результате чего улучшился контекстный поиск, оптимизировано отображение списков и других элементов оформления, которые выводятся через javascript для уменьшения трафика.

4) Появилась настройка интерфейса, в которой можно установить начальную страницу (по умолчанию - Главная), "легкий" дизайн (без картинок), вид поисковой формы (укороченная или расширенная), прямые ссылки на документы (для тех, у кого проблемы с popup-окнами) и просмотр расширенной информации (это увеличивает трафик, но более информативно). Настройки запоминаются в "куках".

5) Почти незаметно появился раздел "Первинні законодавчі акти". После нового созыва пришлось переделывать механизм расчета документов по главным и профильным комитетам на основе данных законопроектов. А юристы среди всей массы законодательных актов выделили такие, в которые могут вносить изменения и назвали их "первинними". Туда входят: Конституция, Кодексы, действующие Законы ВР Украины и УССР, в которые могут вноситься изменения, Декреты КМУ, которые действовали, как Законы. В списках такие документы отображаются специальным значком:

6) Внедрен механизм балансировки нагрузки между серверами, так как нагрузка на один стала такова, что он уже не справляется. В связи с этим внедрена внешняя статистика: от bigmir(net и Gemius. На сегодня у нас были пики около 27 тысяч в день, и более 2 тыс. онлайн.

7) Изменения коснулись и почтовой рассылки. Так как пользователи часто заводят "шаровые ящики" и потом без предупреждения бросают их, то подписка на новости возвращается назад. В тот момент, когда количество "неживых" адресов превысило 1000, и забился буфер отправки sendmail, я решил что руками делу не поможешь... Только головой! =) Вследствии чего, возвратные письма теперь анализируются и автоматически после уведомления уничтожаются.

8) В текстах документов появилась управляющая панель, в которой есть кнопки: карточка, связанные документы, законопроект (если есть), редакции и термины (но они доступны только в Интранет), аннотации на английском, увеличение шрифта, версия для печати, поиск внутри текста (кстати, очень удобный, можно передвигаться от одного слова к другому, нажимая на него), и самое  полезное - проверка орфографии Орфусом!

9) Для новых депутатов создал презенташку по сайту. Может кому интересно - она тут... (PowerPoint). В связи со сменой главной страницы на Портал, была утеряна ссылка на привычное начальное меню. Поэтому я собрал все сервисы на своей страничке. И судя по статистике она сразу стала популярной у пользователей и поисковиков.

10) Добавил в структуре раскладку "статус документов", разделил для списков органы власти, международные организации и страны. Для тех органов, которые имели свои странички в Интернет прописал их, теперь сайтом можно пользоваться в качестве справочника и мини-каталога. Прийдется работать над этим ресурсом больше, чтобы сделать качественно историю, иерархию и склеивать связанные органы. Для стран заготовил все флажки и гербы, они лежат, ждут своего часа, пока я закончу возиться с форматами...

Просто пока я один, и уже два года, как мне обещали дать помошника, но так и не дали. Не успеваю все задуманное охватить, а начальство также "радует" новыми заданиями... Вот такая новость. =) Желаю всем удачи и поздравляю с приходом зимы!

Tags: ,
(6 комментариев | Оставить комментарий)

Реклама

Настроить