Социальные сети Рунета
Пятница, 22 октября 2021

Эксперимент в распознавании рукописных текстов на кириллице Распознавание рукописного текста (англ. Handwritten Text Recognition, HTR) - это автоматический способ расшифровки записей с помощью компьютера.  Оцифрованный текст рукописных записей позволило бы автоматизировать бизнес процессы множества компаний, упростив работу чело...

[Перевод] Как распознать рукописный текст с помощью ИИ на микроконтроллерах Распознавание рукописных цифр с помощью TensorFlow и MNIST стало довольно распространённым введением в искусственный интеллект (ИИ) и ML. «MNIST» — это база данных, которая содержит 70 000 примеров рукописных цифр. Она широко используется как источник изображений для обуче...

Google запустил распознавание рукописного ввода в ML Kit Google сообщает, что с новым Digital Ink Recognition API разработчики могут позволить пользователям вводить текст и цифры пальцем или стилусом, транскрибировать рукописные заметки.

Google Lens получила функцию распознавания рукописного текста Google объявила о добавлении новой функции в Google Lens. Новая функция позволит пользователю копировать и вставлять рукописный текст с телефона на компьютер. Но есть одно но, почерк должен был достаточно аккуратным. Пользоваться новой функцией очень просто. Необходима пос...

Сколько нужно программистов и прописей, чтобы распознать рукописный паспорт? Как думаете, часто ли встречаются рукописные паспорта в нашей стране? Когда мы в Smart Engines начинали проектировать систему распознавания паспортов, казалось, что достаточно научить систему качественно распознавать машинописные документы. На тот момент наличие рукописных п...

Handwritten Digit Recognition: распознавание рукописных цифр Handwritten Digit Recognition — iOS-приложение, которое распознает рукописные цифры. Написано на Swift, использует TensorFlow Lite с натренированной Keras базой. Исходники: https://github.com/sevakon/handwritten-digit-recognition

Учёные придумали, как набирать текст на компьютере силой мысли Группа учёных из Стэнфордского университета создала экспериментальное устройство, которое обещает помочь парализованным людям свободно общаться в электронной переписке. Метод оказался настолько удобным для набора текстов силой мысли, что учёные говорят о возможности навечно ...

[Перевод] Как при помощи ИИ сделать распознавание вводимых вами рукописных цифр прямо в браузере Эта статья для новичков и не претендует на высокий технический уровень, а если вам интересны сложные современные решения, обратите внимание, например, на статью о GIRAFFE, который для генерации реалистичного движения объединяет самые современные подходы в ИИ.В конце статьи в...

Google Lens теперь может произносить рукописный текст и копировать его на компьютер Компания Google обновила свою технологию распознавания изображения и текста Google Lens, которая теперь имеет произносить отсканированный вами текст и копировать его на компьютер. Достаточно просто отсканировать текст при помощи камеры смартфона и нажать кнопку «С...

Распознавание дорожных знаков Компьютерное зрение — это область компьютерных наук, которая фокусируется на воспроизведении частей сложной системы зрения человека и позволяет компьютерам идентифицировать и обрабатывать объекты на изображениях и видео, а также людей. Ранние эксперименты в области компьютер...

В Google Lens теперь можно скопировать рукописный текст и отправить его на ПК Компания Google добавила в свой инструмент распознавания объектов Lens новую функцию, которая может быть полезной многим пользователям. Теперь появилась возможность копировать со смартфона рукописные заметки и вставлять их на компьютере. Правда, это работает только в том слу...

Примеры архитектур нейронных сетей для решения пяти прикладных задач Всем привет! Первый пост на Хабре и сразу хардкорная тема на злобу дня. Думаю, многие разработчики искусственного интеллекта для решения прикладных задач задумывались, какие архитектуры нейронок наиболее эффективны в контексте конкретных задач. Сразу оговорюсь, что приведенн...

[Перевод] Распознавание маски на лице с помощью YOLOv3 YOLO или You Only Look Once — это архитектура свёрточных нейронных сетей, которая используется для распознавания множественных объектов на изображении. В 2020, на фоне пандемии, задача детектирования объектов (object detection) на изображении стала как никогда актуальной. Эт...

Генерируем странные кулинарные рецепты с помощью TensorFlow и рекуррентной нейронной сети (пошаговая инструкция) TL;DR Я натренировал LSTM (Long short-term memory) рекуррентную нейронную сеть (RNN) на наборе данных, состоящих из ~100k рецептов, используя TensorFlow. В итоге нейронная сеть предложила мне приготовить "Сливочную соду с луком", "Клубничный суп из слоеного те...

[Перевод] Идея, взятая из физики, помогает ИИ работать в высших измерениях Законы физики не меняются от смены точки зрения. Однако эта идея помогает компьютерам распознавать определённые особенности в искривлённом пространстве высших измерений. Компьютеры учатся водить автомобили, обыгрывают чемпионов мира в настольные игры, и даже пишут прозу. П...

Как преобразовать текст в алгебру Как пишут тексты в Большой Академии в ЛагадоАлгебра и язык (письменность) являются двумя разными инструментами познания. Если их объединить, то можно рассчитывать на появление новых методов машинного понимания. Определить смысл (понять) – это вычислить как часть соотносится ...

Как обучить нейронную сеть DeepPavlov на ноутбуке с использованием GPU В этой статье я хочу поделиться своим опытом использования данной open-source библиотеки на примере реализации одной задачи с парсингом файлов PDF/DOC/DOCX содержащих резюме специалистов. Здесь я также опишу этапы реализации инструмента для подготовки датасета. После чего м...

Новая функция MIUI 12 — распознавание текста на фото и в документах В MIUI 12 появилась новая и очень полезная функция OCR — распознавания текста на обычных фото и фото документов. С ее помощью легко перевести текст на изображении в редактируемый формат. Выполнить такое можно и при помощи сторонних программ, но MIUI 12 позволит де...

С новым контроллером E Ink рукописный ввод станет быстрее С прошлого года одной из точек роста компании E Ink заявлены электронные блокноты с поддержкой рукописного ввода. И всё бы ничего, только электронная «бумага» E Ink отличается низкой скоростью обновления экрана, что также может приводить к задержкам изображения при вводе тек...

Как работает распознавание рукописного ввода в iPadOS 14 и зачем оно нужно Scribble (в переводе «каракули» или «мазня») представили на WWDC очень достойно. Эту технологию заметили, но объявление Mac с Apple Silicon затмило ее. Между тем, это едва ли не самая важная новость из всех объявленных в тот день. Возможно, уже через нес...

[Из песочницы] Нормализация текста в задачах распознавания речи При решении задач, связанных с распознаванием (Speech-To-Text) и генерацией (Text-To-Speech) речи важно, чтобы транскрипт соответствовал тому, что произнёс говорящий — то есть реально устной речи. Это означает, что прежде чем письменная речь станет нашим транскриптом, её нуж...

Поиграем в слова? Автоматическое распознавание букв и нахождение слов в игре Слово В данной статье на примере проекта, архитектура которого приведена на фото, вы сможете найти ответы на следующие вопросы:- Как работает алгоритм нахождения слов в игре типа Boggle?- Как предобработать изображение для дальнейшего распознавания букв с помощью OpenCV?- Как расп...

В VK появился перевод голосовых сообщений в текст Распознавание голосовых сообщений автоматизировано и проводится при помощи искусственного интеллекта.

Платформа Mail.ru Cloud Solutions масштабирует систему оцифровки документов сервисов Beorg Smart Vision Компания «Биорг» перенесла свои сервисы по распознаванию сложных объектов и данных, включая рукописный текст на облачную платформу Mail.ru Cloud Solutions (MCS). Платформа обеспечит конфиденциальность, скорость обработки и передачи ...

Пробел не так прост как кажется Всем привет! Как вы уже знаете, мы в SE занимаемся распознаванием текста (и не только) на разных документах. Сегодня мы хотели бы рассказать еще об одной проблеме при распознавании текста на сложных фонах — о распознавании пробелов. Вообще, мы будем говорить об имени на банк...

Apple тестирует рукописный ввод во всех приложениях iPad В данный момент использование стилуса Apple Pencil для ввода текста возможно только в системном приложении «Заметки» (Notes). Причем в рукописных записях можно искать слова, но полноценно перевести их в текст нельзя. Однако, по информации портала Macrumors, полноценный ввод ...

Новое в iOS 14: Как рисовать с распознаванием фигур на iPhone и iPad Будем откровенными – вносимые нами в рукописные заметки рисунки зачастую выглядят так, как будто их рисовал неумелой рукой ребенок в детском саду. К счастью, с выходом iOS 14 и iPadOS 14 появилось распознавание форм, превращая каракули в аккуратные геометрические формы, кото...

Распознавание эмоций в записях телефонных разговоров В этой статье хочу рассказать о том, как я создавала сервис для распознавания эмоций на основе анализа записей деловых телефонных разговоров. Читать статью

ruCLIP — мультимодальная модель для русского языка Известно, что глубокие нейронные сети (DNN) и модели компьютерного зрения, в частности, хорошо справляются с конкретными задачами, но зачастую не могут сделать обобщение при работе с новыми. Так, модель, которая хорошо работает с данными о продуктах питания, может показать с...

Наиболее полное руководство по практическому использованию Web Speech API В этой статье я хочу поделиться с вами результатами изучения основных возможностей Web Speech API (далее — WSA). Введение WSA — это экспериментальная технология, состоящая из двух интерфейсов: SpeechSynthesis (интерфейс для перевода текста в речь) и SpeechRecognition (интер...

Альтернативный метод классификации поля «пол» паспорта РФ с помощью нейронной сети Источник: https://wiki.loginom.ru/articles/clustering.html Задача распознавания текста не теряет своей актуальности на протяжении последних десятилетий. А сейчас, в период повсеместного введения дистанционного оформления документов, не обойтись без процедуры идентификации л...

Распознавание речи с помощью инструментов машинного обучения В своей работе я столкнулся с необходимостью проверить записи звонков на соблюдение сотрудниками скрипта разговора с клиентами. Обычно для этого выделяется сотрудник, который тратит большое количество времени на прослушивание записей разговоров. Мы поставили себе задачу — ум...

Make <your iOS app> talk. Доклад Яндекса Cтандартные библиотеки распознавания речи и озвучки текста в iOS дают массу возможностей. Из доклада VolkovRoman вы узнаете, как за счёт минимального количества кода научить ваше приложение проговаривать текст и кастомизировать озвучку. Рома рассмотрел API распознавания речи...

OCR-конвейер для обработки документов Сегодня я расскажу о том, как создавалась система для переноса текста из бумажных документов в электронную форму. Мы рассмотрим два основных этапа: выделение областей с текстом на сканах документов и распознавание символов в них. Кроме того, я поделюсь сложностями, с которым...

Сканер и распознавание текста для iPhone, Android и компьютера бесплатно: 7 лучших программ Перечисленные ниже сервисы для распознавания содержимого изображений и отсканированных документов помогут быстро и совершенно бесплатно перенести текст для его последующего редактирования. ♥ ПО ТЕМЕ: Как передать гостям пароль от Wi-Fi, при этом не называя его (QR-код). ...

Apple Pencil iOS 14 получит поддержку преобразования рукописного текста Apple работает над добавлением преобразования рукописного текста. Эта функция позволит пользователям использовать Apple Pencil для записи в любом текстовом поле, после чего она автоматически преобразует в печатный текст, благодаря OCR. Преобразователь рукописного текста в ...

Apple, почему бы не сделать iPad с матовым экраном? Одним из ключевых особенностей новой iPadOS 14 стала расширенная поддержка Apple Pencil. Apple сделала ряд улучшений для iPad, чтобы улучшить интеграцию между своими планшетами и Apple Pencil, наиболее заметным из которых является новая функция Scribble. Это распознавание р...

[Перевод] История интерпретируемости в распознавании изображений Распознавание изображений (т. е. классификация того, какой объект отображается на изображении) является основной задачей в области компьютерного зрения, так как она позволяет использовать различные последующие приложения (автоматическая маркировка фотографий, помощь слабов...

Представлено МФУ Lenovo с функцией распознавания ошибок в тексте Компания Lenovo представила многофункциональное устройство Lenovo Xiaoxin Panda, которое оснащено интеллектуальной системой сканирования и функцией распознавания текста. С точки зрения дизайна Lenovo Xiaoxin Panda похож на обычные принтеры. Его можно использовать как ск...

Зачем нужен Google Объектив Экосистема Google состоит из большого количества приложений и сервисов. Настолько большого, что ей, чтобы быть самодостаточной, оказались даже не особенно нужны аппаратные решения. Безусловно, умные колонки Google Nest и смартфоны Google Pixel очень технологичны и удобны, н...

Книга «Python: Искусственный интеллект, большие данные и облачные вычисления» Привет, Хаброжители! Пол и Харви Дейтелы предлагают по-новому взглянуть на Python и использовать уникальный подход, чтобы быстро решить проблемы, стоящие перед современными айтишниками. В вашем распоряжении более пятисот реальных задач — от фрагментов до 40 больших сценар...

[Перевод] Рекуррентные нейронные сети (RNN) с Keras Перевод руководства по рекуррентным нейросетям с сайта Tensorflow.org. В материале рассматриваются как встроенные возможности Keras/Tensorflow 2.0 по быстрому построению сеток, так и возможности кастомизации слоев и ячеек. Также рассматриваются случаи и ограничения использов...

Во «ВКонтакте» можно не слушать даже длинные голосовые сообщения Команда социальной сети «ВКонтакте» рассказала о новых возможностях технологии  распознавания голосовых сообщений.  Теперь за секунду можно расшифровать записи продолжительностью до двух минут — это 99% всех аудио, которые отправляют пользов...

[Из песочницы] Предлагаю подумать: как технологии могут помочь бороться с пропагандой в СМИ? Фотограф: Аркадий Шайхет. Вступление Эту статью можно разделить на две логические части. В первой я рассматриваю феномен медиапропаганды: что это такое, почему она опасна и к каким жутким вещам уже приводила в истории. Я подробно рассмотрю механизмы работы современной гос...

Представлена iPadOS 14 для планшетов Купертиновская компания Apple официально представила не только операционную систему для смартфонов, но и для планшетов.Новая ОС называется iPadOS 14. Платформа для планшетов, аналогично iOS 14, приносит возможность размещать на домашнем экране виджеты приложений.Несколько из...

Сравниваем работу open source Python — библиотек для распознавания именованных сущностей Введение Мы в компании создаем сервис, который позволяет автоматически создавать, управлять и безопасно хранить лицензионные соглашения и прочие договоры между фрилансерами и их клиентами. Для решения это задачи я опробовал десятки решений в области обработки естественного...

[Из песочницы] Вступление в работу с возвратом пользователя: советы для Hooked-модели Всем привет! Я — Сергей, R&D officer в Genesis. В этом тексте хочу поделиться своими знаниями и опытом по созданию привычки использования продукта, рассказать о том, как это влияет на прибыльность бизнеса и почему предпринимателей встречают по возврату. Читать дальше &...

[Из песочницы] Генерируем тексты песен Кис Кис цепями Маркова в 50 строк Сегодня я хочу рассказать про свой опыт генерации текста песен с помощью python и библиотеки Markovify Дисклеймер: автор хотел повеселить себя вечером и не придумал ничего лучше, как: В качестве корпуса для "обучения" цепи я буду использовать текст песен группы Ки...

[Перевод] 52 датасета для тренировочных проектов Mall Customers Dataset — данные посетителей магазина:id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning) Iris Dataset — датасет для новичков, содержащий размеры чашелистиков и лепестков для различных цветков. MNIS...

В MIUI 12 снова добавили интересные функции Помимо распространения финальной версии MIUI 12 для совместимых устройств компания Xiaomi продолжает добавлять новые функции в еженедельные бета-версии MIUI 12. За последние несколько месяцев компания представила новые функции, такие как частичный снимок экрана, режим ч...

Смарт-реплай стикерами Привет, Хабр! Сегодня мы перезапустили ICQ. Ключевые функции нового мессенджера основаны на технологиях искусственного интеллекта: система быстрых подсказок стикеров и текста Smart Reply для ответа на пришедшее сообщение, предложение стикеров по введенным фразам, распознаван...

"Сбербанк" привлек заключенных к обучению искусственного интеллекта Банк договорится о сотрудничестве с ФСИН. В рамках пилотного проекта заключенные из Новосибирска обучают искусственный интеллект распознавать рукописный текст и детали изображений.

«Умную» ручку научили «зачитывать» текст при нажатии на рукописные буквы Специалисты компании NeoLAB научили «умную» ручку «зачитывать» текст при нажатии на рукописные буквы. Это может пригодиться во время лекций.

[Из песочницы] Архитектура нейронной сети RetinaNet Данная статья посвящается объяснению устройства архитектуры нейронной сети RetinaNet. Обзор был проведён мною в ходе выполнения дипломной работы, а так как для его написания потребовалось обращаться исключительно к англоязычным источникам и собрать найденную информацию воеди...

Что такое графовые нейронные сети Графовые сети — это способ применения классических моделей нейронных сетей к графовым данным. Графы, не обладая регулярной структурой как изображения (каждый пиксель имеет 8 соседей) или тексты (последовательность слов), долгое время оставались вне поля зрения классических ...

МВД строит ИТ-систему на основе ИИ для раскрытия серийных преступлений Как сообщает CNews, соответствующий тендер размещен 20 августа 2021 г. Заявки принимаются до 13 сентября, итоги будут подведены 20 сентября. Максимальная цена контракта составит 23,1 млн руб. Исследованию присвоен шифр "Серия".Целью исследования, в том числе, являе...

HoughNet: поиск точек схода сетью, сплавленной с классическим алгоритмом Пока в мире распознавания объектов обучают десятки и даже сотни зарекомендовавших себя архитектур искусственных нейронных сетей (ИНС), разогревая планету мощными видеокарточками и создавая «панацею» для всех задач компьютерного зрения, мы в Smart Engines твердо идем по иссл...

Как автоматизировать оповещения о статусе заказов через Telegram-бота, Computer Vision и SQL Anywhere В современном мире услуги доставки становятся всё более популярными и востребованными, поэтому любая возможность автоматизации в этой сфере принесёт большую пользу как бизнесу, так и пользователям. В прошлых статьях нашего блога мы рассказывали о применении машинного зрения ...

ML в облаке: как я попробовал Yandex DataSphere и почему его так непросто сравнить с Google Colab Привет, Хабр! Меня зовут Дмитрий (@pagin), и я специализируюсь на вопросах ускорения и уменьшения свёрточных сетей. Моя основная работа — распознавание автомобилей и классификация транспорта, поэтому я обучаю много небольших CNN и часто пользуюсь облачными сервисами для ML. ...

[Перевод] Как преобразовать текст в речь с использованием Google Tesseract и Arm NN на Raspberry Pi Привет, Хабр! Сегодня специально к старту нового потока курса по Maсhine Learning делимся с вами постом, автор которого создаёт устройство преобразования текста в речь. Такой механизм преобразования текста в речь (TTS) — ключевой элемент систем, которые стремятся сформирова...

Microsoft анонсировала улучшения рукописного ввода в Microsoft Edge Microsoft объявила о нескольких значительных улучшениях в опыте рукописного ввода в браузере Edge. Это обновление теперь доступно в каналах Microsoft Edge Canary и Dev, а также содержит некоторые новые функции для инсайдеров Edge. «Мы слышали отзывы об опыте написания в Edge...

[Перевод] Прогнозирование временных рядов с помощью рекуррентных нейронных сетей Удалённый режим работы на фоне всеобщей самоизоляции может привести к весьма дурным последствиям. И эмоциональное выгорание – это ещё куда ни шло: там ведь и до крыши недалеко. В этой связи, как и многие, попробовал «успокоить» себя выделением времени на другие занятия – и н...

Google научила свое приложение распознавать и оцифровывать рукописный текст Как стало известно, Google выпустила свежее обновление Google Lens — теперь приложение способно распознавать и оцифровывать рукописный текст.

4 полезных функции «Google Объектива», о которых вы могли не знать Копируйте рукописный текст прямо на компьютер, ищите непонятные термины и учите иностранные слова.

Автоматический анализ документов Привет, Хабр! В этой статье я расскажу о том, как восстановить структуру таблицы и извлечь рукописные числа из отсканированного документа такого плана. Читать далее

Искусственные нейронные сети. Часть 1 В этой статье вы познакомитесь с основами работы искусственных нейронов. В последующих статьях мы изучим основы работы нейронных сетей и напишем простейшую нейронную сеть на python. Читать далее

Искусственный интеллект впервые создаст корпус древнеславянских рукописных текстов «Во дни сомнений, во дни тягостных раздумий о судьбах Родины», которые особенно тяжки в последние недели, что для нас поддержка и опора? :) Правильно, великий и могучий. И пока курсы валют и пандемия неумолимо владеют массовым сознанием, ученые не прекращают работу. О том, ...

Российские Samsung Galaxy S20 получили большое обновление с популярными функциями Galaxy Note20 Российская пресс-служба компании Samsung Electronics объявила о выпуске фирменной оболочки One UI 2.5 для смартфонов серии Galaxy S20.  Апдейт включает в себя некоторые из популярных функций новой серии Note20 и будет постепенно применяться к другим устройствам Ga...

[Перевод] Делаем печатные ссылки кликабельными с помощью TensorFlow 2 Object Detection API TL;DR В этой статье мы начнем решать проблему того, как сделать печатные ссылки в книгах или журналах кликабельными используя камеру смартфона. С помощью TensorFlow 2 Object Detection API мы научим TensorFlow модель находить позиции и габариты строк https:// в изображениях ...

Google добавил новые инструменты в AI-приложение Google Lens Google добавил новые инструменты в AI-приложение Google Lens. Среди новых функций Google выделила возможности копирования рукописного текста с листа бумаги и его последующей вставки на другое устройство. Подробнее об этом читайте на THG.ru.

[Перевод] Как машинное обучение помогает открыть мир Древней Японии Богатая история человечества оставила после себя огромное количество исторических документов и артефактов. Однако практически все документы, содержащие рассказы и записанный опыт, имеющие существенное значение для нашего культурного наследия, понятны только специалистам по...

[Перевод] Создание Live Text на Android Одной из новых функций, анонсированных на WWDC в этом году, стал Live Text. Она позволяет пользователям выбирать, переводить и искать текст в любом изображении. На демонстрации во время основного доклада была показана доска для совещаний с рукописным текстом. Когда открыли п...

Tesseract vs таблицы. Распознавание документов В данной статье описан пример распознавания сложного документа с таблицами с помощью tesseracta. Читать далее

«Почта России» начнёт автоматически переводить рукописные письма в электронный формат Федеральный оператор связи объявил о пилотном проекте по оцифровке почтовой корреспонденции. Представитель «Почты России » заявил, что их клиенты смогут получать как сканы рукописных и напечатанных писем, если это необходимо, так и подключить весь процесс обмена корреспонден...

Распознавание текста на фото в iOS 15: как работает Функция распознавания текста, благодаря которой iPhone и iPad способны находить на фото и в поле зрения их камеры печатный и рукописный текст и распознавать его – один из главных вау-факторов новой версии iOS. Что-то такое где-то уже было? Было, не стану отрицать. Но к “был...

AutoDraw от Google, или как превратить нарисованные от руки каракули в полноценные рисунки В настоящее время никого не удивить приложениями, способными превращать рукописный текст в печатный. Если можно почерк, то почему нельзя рисунки, задались вопросом инженеры Google. Как известно, компания уже некоторое время экспериментирует с искусственным интеллектом и даже...

Детекция аномалий на снимках с БПЛА Medium postОсенью мы с друзьями участвовали в хакатоне DIGITAL SUPERHERO от организаторов хакатона ИТС и СЦ, о котором я писал в статье. Хакатон проходил с 18 по 23 сентября 2020 года. Мы выбрали задачу Распознавание аномалий (объектов и инцидентов) на фотоматериал...

[Перевод] Разработка PWA с поддержкой распознавания лица и голоса Этот материал посвящён продвинутым возможностям PWA (Progressive Web Application, прогрессивное веб-приложение), основанным на некоторых современных API. А именно, здесь мы поговорим о разработке веб-проекта, поддерживающего распознавание лица и голоса. Тем, что раньше было ...

Cлайдер с голосовым управлением на JavaScript Доброго времени суток, друзья! Я тут слайдер написал с голосовым управлением, распознаванием текста и его чтением (озвучиванием) средствами браузера. Функционал: Смена слайдов по нажатию кнопок или стрелок на клавиатуре Тоже самое по голосовым командам «вперед» и «назад...

Приложение Google Lens научилось распознавать рукописный текст и переносить его в редакторы Чтобы оцифровать собственные записи, нужно навести на них камеру смартфона и на экране устройства выделить фрагмент текста.

86-дюймовый планшет за 7000 долларов. TCL представила устройство для видеоконференций Компания TCL представила огромный планшет для видеоконференций TCL V30, который будет доступен с экранами диагональю 65, 75 и 86 дюймов по цене около 2100, 3500 и 7000 долларов соответственно. TCL V30 может быстро переключаться между операционными системами Android и Wi...

Как улучшить распознавание русской речи до 3% WER с помощью открытых данных Меня зовут Николай, когда в 2009 году я защищал диссертацию по распознаванию речи, скептики мне говорили, что слишком поздно, так как Microsoft и Google уже “всё сделали”. Сейчас в SberDevices я обучаю модели распознавания речи, которые используются в семействе виртуальных а...

Как перевести цифровой текст в рукописный Любой язык существуют в двух написаниях, один из которых является рукописным, а другой – печатным. С каждым годом все больше и больше людей переходят на цифровой текст, так как он является более удобным с точки Сообщение Как перевести цифровой текст в рукописный появились с...

Энтузиаст из России создал сервис для генерации рукописного текста В российских учебных заведениях есть огромная проблема — необходимость частенько писать целые полотна текста от руки. К счастью, энтузиаст из России создал специальный сервис для генерации рукописного текста.

Как распознать рукописный текст на Android и отправить его на компьютер Экосистема Google, несмотря на то что её практически целиком формируют именно программные продукты, а не аппаратные, очень богата и обширна. Она настолько функциональна и самодостаточна, что может не только работать на любых устройствах, но и просто взаимодействовать с серв...

Генетический алгоритм для сегментаций строк в рукописном документе Генетический алгоритм (GA)Генетический алгоритм - это классический эволюционный алгоритм, основанный на случайной переборе параметр. Под случайным здесь мы подразумеваем, что для поиска решения с использованием ГА, случайные изменения применялись к текущим решениям для ...

ВКонтакте тестирует систему распознавания голосовых сообщений ВКонтакте начала тестировать распознавание голосовых сообщений на русском языке и вскоре предложит для этой функции собственную технологию. Узнать содержание записи можно будет даже тогда, когда не хочется или не получается ее послушать - достаточно нажать кнопку и прочитать...

Шесть аэропортов РФ будут использовать биометрическую идентификацию к 2024 году "К 31.12. 2023 количество субъектов транспортной инфраструктуры воздушного транспорта (аэропортов), использующих биометрические данные идентификации пассажиров и обработку их с использованием искусственного интеллекта для упрощения транспортных процедур, составит шесть ...

ОК запустили сервис распознавания аудиосообщений Новый сервис сделает общение в ОК более комфортным в ситуациях, когда прослушать голосовое сообщение невозможно: в общественном транспорте, во время совещания с коллегами или во время просмотра фильма. Технология распознает как полученные, так и отправленные голосовые сообще...

[Перевод] Разбираемся в моделях кода архитектуры x64 «Какой моделью кода мне воспользоваться?» — часто возникающий, но нечасто разбираемый вопрос при написании кода для архитектуры х64. Тем не менее, это довольно интересная проблема, и для понимания генерируемого компиляторами машинного кода х64 полезно иметь представление о м...

Как я пробовал написать статью голосовым вводом, и что из этого получилось Как я написал статью голосовым вводом Смартфоны уже давно стали чем-то большим, чем просто телефоны. Мы каждый день используем наш гаджет для переписки с друзьями, просмотра видеороликов на YouTube, общения в Telegram, и при этом сегодня телефон для многих может стать замено...

NLP: ВЫДЕЛЯЕМ ФАКТЫ ИЗ ТЕКСТОВ С ПОМОЩЬЮ ТОМИТА-ПАРСЕРА NLP - natural language processingБольшая часть данных в мире не структурирована – это просто тексты на русском или на любом другом языке. Извлеченные факты из таких текстов могут представлять особый интерес для бизнеса, поэтому подобные задачи возникают сплошь и рядом. Этим ...

Microsoft работает над API для улучшения рукописного ввода в Microsoft Edge и Google Chrome Рукописный ввод вскоре будет улучшен в Microsoft Edge и Google Chrome благодаря новым API

Представлена iPadOS 14 — с новыми виджетами и улучшенным распознаванием рукописного ввода Компания Apple представила на WWDC обновлённую версию iPadOS. Как и в iOS 14, в iPadOS 14 появилась поддержка новых виджетов.

Google выпустила приложение, обучающее детей чтению Компания Google выпустила новое приложение Read-Along, которое призвано учить детей читать.Приложение пока что доступно только на платформе Android. В основе Read-Along лежит приложение Google Bolo, дебютировавшее в Индии еще в прошлом году. В данный момент Read-Along поддер...

Искусственный интеллект сочинил оригинальную песню на основе текстов Nirvana Ютьюб-блогер Funk Turkey в результате экспериментов с искусственным интеллектом, в который он предварительно «загрузил» тексты Nirvana, получил на выходе совершенно новую песню в стиле культовой группы. О ее художественных и музыкальных достоинствах можно сказать одно: на лю...

Как распознать промышленные детали по фотографиям с помощью машинного зрения Привет, Хабр! Сегодня поговорим о том, как нейронные сети могут помочь в распознавании деталей и зачем это вообще нужно. Недавно к нам обратился один из наших клиентов - крупная промышленная компания, производитель грузовых автомобилей и их комплектующих. Детали насчитывали ...

Как прямо сейчас получить функцию Live Text для распознавания текста на фото из iOS 15 Одним из нововведений iOS 15, которую Apple представила на конференции разработчиков 7 июня, стала функция Live Text. Её предназначение состоит в том, чтобы считывать текст на фотографиях, снятых на камеру. Это может быть снимок доски, документа, чека, этикетки и много чего...

Виджеты приходят на iPhone. Релиз iOS 14 и iPadOS 14 уже завтра Компания Apple объявила точную дату выпуска своих мобильных операционных систем iOS 14 и iPadOS 14.  Стабильные версии iOS 14 и iPadOS 14 станут доступны обычным пользователям с завтрашнего дня, 16 сентября. Установить iOS 14 можно на iPhone 6s и новее, iPhone SE ...

Автоматизация рутины в DotA 2 или читы? Привет, в этой статье будут рассматриваться легальные способы получить преимущество перед противником с помощью таких простых средств, как NodeJS, Electron и React, при этом обходя бан стороной. На эксперименты меня вдохновила другая статья Визуализация времени возрождения Р...

СКУД, распознающая лица и автомобильные номера. Hikvision представил новые устройства для контроля доступа Помимо систем видеонаблюдения, компания Hikvision с 2017 года производит также оборудование для систем контроля доступа, видеодомофонии и охранных систем. В 2020 году и без того широкая линейка этих устройств пополнится моделями с расширенным функционалом, соответствующим за...

Регуляризация? Ортогонализация! Улучшаем компактные сети Пока другие компании обсуждают управление коллективом на удаленке, мы в Smart Engines продолжаем делиться с вами своим стеком технологий. Сегодня про оптимизацию нейронных сетей. Сделать систему распознавания на основе нейронных сетей, которая могла бы быстро работать на см...

Распознаем речь в Авроре Аврора, созданная во многом с прицелом на корпоративное использование, часто используется в не совсем привычных для нормального человека условиях. Когда мобильное устройство — корпоративное, а передаваемая информация имеет не только ту ценность, которую охраняет закон о перс...

iPad может научиться распознавать рукописный текст Согласно информации, найденной в коде iOS 14, сейчас купертиновцы работают над новой функцией под названием PencilKit. Она должна помочь владельцам яблочных планшетов распознавать рукописный текст и преобразовывать его в надписи, доступные для последующего редактирования.Чит...

Появился первый браузер для Android с переводом текста на изображениях Команда Яндекса объявила о знаковом обновлении мобильного Яндекс.Браузер. Как отмечает пресс-служба, Яндекс.Браузер стал первым браузером для Android с переводом текста на изображениях.  Ранее перевод текста на изображениях предлагался Яндексом в компьютерной верс...

Японский поставщик ИТ-услуг для магазинов Smaregi внедрил в мобильные приложения распознавание паспортов от Smart Engines Компания Smaregi, провайдер ИТ-услуг для более 98 000 магазинов Японии, внедрила технологию безопасного распознавания паспортов российской компании Smart Engines. Автоматическое извлечение паспортных данных позволит значительно упростить процедуру ...

Apple показала, как пользоваться функцией распознавания звука в iPhone и iPad Купертиновская компания опубликовала официальное видео, в котором рассказала о функции распознавания звука.Данная опция доступна в iPhone и iPad. Если вы не в курсе, как ее запустить, то отправляйтесь в «Настройки», далее следуйте в раздел «Универсальный до...

Разработано решение для удаленного распознавания признаков коронавируса Радиологическая информационная система позволяет автоматизировать работу радиологической службы, организовать дистанционную работу и проведение удаленных консультаций по анализу и описанию диагностических исследований - вне зависимости от места нахождения специалистов. Испол...

Читать не надо слушать: как работает распознавание речи ВКонтакте Прочитать текстовое сообщение — быстрее, чем прослушать голосовое. Ещё по тексту удобнее искать и уточнять детали. Воспринимать числа, адреса, номера телефонов и подобную информацию тоже проще в написанном виде. С другой стороны, записать голосовое зачастую удобнее, чем напе...

11 лайфхаков, которые сделают работу с PDF максимально удобной Сравнение файлов, распознавание текста и другие полезные функции ABBYY FineReader 15.

Доббль: практичный подход с OpenCV и NumPy О чём мы вспоминаем в первую очередь, когда слышим про распознавание образов? Сложные нейронные сети, мощные видеокарты, объёмные наборы данных. Всего этого не будет в моей истории - я расскажу, как с помощью OpenCV и NumPy можно за 1 вечер решить задачу классификации 57 сим...

Краткость — сестра таланта: Как сделать Transformer/Summarizer на Trax В новой курсеровской специализации «NLP» от deeplearning.ai в качестве библиотеки глубокого обучения используется Trax. В последнем курсе подробно разбирается механизм внимания и его использование в архитектуре Transformer, в том числе в таких «новеллах» как BERT и T5. Имея...

86-дюймовый ULTRA HD дисплей LG 86TN3F Компания LG Electronics анонсировала в России интерактивный 86-дюймовый ULTRA HD дисплей LG 86TN3F. Сенсор дисплея точно определяет даже незначительные касания (возможность одновременного распознавания до 20 касаний), поэтому устройство может использоваться для реалистичног...

Масштабная утечка: что нового будет в iOS 14 Мы уже выяснили, что обновления – самый надёжный источник информации о новых продуктах Apple. Ведь если Евразийская экономическая комиссия в основном сливает только названия аппаратных новинок, обозначая примерный список устройств, которые следует ждать в ближайшее время, т...

[Перевод] Использование ИИ для сверхсжатия изображений Управляемые данными алгоритмы, такие как нейронные сети, взяли мир штурмом. Их развитие вызвано несколькими причинами, в том числе дешевым и мощным оборудованием и огромным объемом данных. Нейронные сети в настоящее время находятся в авангарде во всем, что касается «когнити...

Как я познакомился с Apple Pencil. Приложение Nebo Компания Apple изначально была скептически настроена по отношению к стилусам. Многие годы Samsung со своей линейкой Galaxy Note не оставляли выбора для многих представителей творческих профессий. Однако реализация умного пера от Купертино сильно подорвала количество продаж ...

Распознавание текста на картинке с помощью tesseract на Kotlin Ни для кого не секрет, что Python прочно занял первенство в ML и Data Science. А что если посмотреть на другие языки и платформы? Насколько в них удобно делать аналогичные решения? К примеру, распознавание текста на картинке. Читать дальше →

«Вы уж простите, обознался...» или распознаем малину и контроллеры с помощью Tensorflow Object Detection API В конце прошлого года, я написал статью, о том как был заинтригован возможностью распознавания объектов на изображениях с помощью нейронных сетей. В той статье мы с помощью PyTorch классифицировали на видео либо ягоду малину, либо ардуино-подобный контроллер. И не смотря на ...

Приложение, обучающее чтению, запустили в 180 странах Приложение Read Along помогает дошкольникам и ученикам начальной школы развить навык чтения. Оно использует технологию распознавания текста и речи Google, чтобы давать ученикам подсказки. Приложение поддерживает девять языков. Впервые приложение было запущено под названием B...

1000 и 1 способ сесть на мель в Spring WebFlux при написании высоконагруженного сервиса Источник изображения: Shutterstock.com/photowind Добрый день, меня зовут Тараканов Анатолий, я senior java разработчик SberDevices. 2.5 года программирую на Java, до этого 6 лет писал на C# и 1 год на Scala. Хочу поделиться опытом создания сервиса-оркестратора Voice Proces...

Microsoft выпустила приложение Group Transcribe для iOS Подразделение Microsoft Garage, занимающееся созданием экспериментальных и инновационных проектов, представило новое приложение Group Transcribe для платформы iOS. Этот проект предназначен для высокоточного транскрибирования и перевода личных бесед или конференций в режиме ...

Новая программа может создавать тексты для инструментальной музыки Технологии IT/Игры 02.07.2021, 08:28 Новая программа может создавать тексты для инструментальной музыки Исследователи представили программу LyricJam — передовую вычислительную систему, которая может генерировать тексты для живой инстру...

[Перевод] Построение моделей Трансформера для больших последовательностей с помощью методов разреженного внимания Модели обработки естественного языка (Natural language processing, NLP) на основе архитектуры Трансформеров, такие как BERT, RoBERTa, T5 или GPT3, успешно применяются в самых различных задачах и являются стандартом современных исследований в области NLP. Гибкость (универсаль...

Книга «Глубокое обучение: легкая разработка проектов на Python» Привет, Хаброжители! Взрывной интерес к нейронным сетям и искусственному интеллекту затронул уже все области жизни, и понимание принципов глубокого обучения необходимо каждому разработчику ПО для решения прикладных задач. Эта практическая книга представляет собой вводный к...

Помощник – «решатель филвордов» на python (алгоритм поиска слов плюс распознавание текста tesseract) На работе, в обеденный перерыв коллега показал игрушку на Яндекс играх – Филворды. Как то не заладилась игра у меня – вроде простые слова, но дело шло медленно. А у товарища уровень был выше 400. Первая  мысль при таком фэйле – конечно, показать глупой машине, что есть ...

Tesseract OCR tips — создание своего словаря для повышения эффективности OCR Это мой первый пост об оптическом распознавании текста (OCR) с использованием Tesseract. Tesserast это очень популярная open source библиотека для OCR поддерживаемая Google, которая дает высокие результаты точности и поддерживает более 100 языков. В этом посте я расскажу как...

Read Along от Google научит детей читать Read Along использует функции распознавания речи и преобразования текста в речь, чтобы помочь детям научиться читать.

[recovery mode] Аудит кошельков в CryptoNote Аудит криптовалютного кошелька — это возможность для третьей стороны («аудитора») видеть транзакции этого кошелька и рассчитывать его корректный актуальный баланс без права на трату средств. В статье рассматриваются различные способы обеспечения такой возможности в крипто...

Анонсирован первый в мире ноутбук с тачпадом, встроенным в клавиатуру Благодаря умной технологии распознавания жестов тачпад автоматически переключается между режимами ввода текста и сенсорного управления

Упадок RNN и LSTM сетей Перевод: Давыдов А.Н.Мы полюбили RNN (рекуррентные нейронные сети), LSTM (Long-short term memory), и все их варианты. А теперь пора от них отказаться!В 2014 году LSTM и RNN, были воскрешены. Но мы были молоды и неопытны. В течении нескольких лет они был способом решения таки...

[Из песочницы] Общий обзор архитектуры сервиса для оценки внешности на основе нейронных сетей Вступление Привет! В данной статье я поделюсь опытом построения микросервисной архитектуры для проекта, использующего нейронные сети. Поговорим о требованиях к архитектуре, посмотрим на различные структурные диаграммы, разберем каждый из компонентов готовой архитектуры, а т...

Насколько неуязвим искусственный интеллект? Сегодня искусственные нейронные сети лежат в основе многих методов «искусственного интеллекта». При этом процесс обучения новых нейросетевых моделей настолько поставлен на поток (благодаря огромному количеству распределенных фреймворков, наборов данных и прочих «заготовок»...

Перефразирование русских текстов: корпуса, модели, метрики Автоматическое перефразирование текстов может быть полезно в куче задач, от рерайтинга текстов до аугментации данных. В этой статье я собрал русскоязычные корпуса и модели парафраз, а также попробовал создать собственный корпус, обучить свою модель для перефразирования, и со...

Как сделать из нейросети журналиста, или «Секреты сокращения текста на Хабре без лишних слов» Только не удивляйтесь, но второй заголовок к этому посту сгенерировала нейросеть, а точнее алгоритм саммаризации. А что такое саммаризация? Это одна из ключевых и классических задач Natural Language Processing (NLP). Она заключается в создании алгоритма, который принимает н...

[Перевод] Распознавание мелодии путем изучения языка тела музыканта Перевод статьи подготовлен в преддверии старта нового набора на курс «Computer vision». Инструмент распознавания музыкальных жестов на основе искусственного интеллекта, разработанный в MIT-IBM Watson AI Lab, использует движения тела, чтобы различать звуки отдельных музык...

Google Lens скачано более 500 миллионов в Play Store Google Lens - это инструмент распознавания изображений, который был впервые продемонстрирован на Google I / O 2017. Также Google Lens - один из многих бесплатных полезных инструментов, предоставляемых Google. Приложение было выпущено в Play Store с июня 2018 года, и теперь ...

Представлен 86-дюймовый планшет TCL V30 Компания TCL пополнила ассортимент своих товаров новыми планшетами для презентаций и видеоконференций.Серия получила название TCL V30, и входят в нее устройства с 65-, 75- и 86-дюймовыми сенсорными экранами с разрешением 8K. Стоимость новинок составляет $2100, $3500 и $7000 ...

Распознавание символов Работа с изображениями — одна из самых распространенных задач в машинном обучении. Мы покажем пример обработки изображения, получение матриц (тензоров) чисел, подготовку данных обучающего множества, пример архитектуры нейронной сети.Работа с изображениями является одной из с...

Open Source датасет SOVA: аудио для распознавания и синтеза речи Всем привет! Мы — команда компании «Наносемантика», и недавно мы запустили проект SOVA, где занимаемся сбором датасета для использования его в обучении нейронных сетей и создания виртуальных ассистентов на базе искусственного интеллекта.Мы подготовили большой датасет для обу...

МегаФон обновил «Цифрового юриста» "Цифровой юрист" разработан совместно с технологическим партнером МегаФона - компанией Nlogic. В основе экосистемы "Цифрового юриста" лежит нейросеть и технология оптического распознавания символов (OCR). Сервис предлагает три продукта для повышения эффек...

Интересные материалы: 05.12 Заканчиваем неделю интерфейсами, распознаванием текста и популярными библиотеками.

8-битные сети на Эльбрусе, есть ли смысл? Привет, Хабр! Мы вдруг поняли, что наша последняя статья про Эльбрус вышла год назад. Поэтому мы решили исправить эту досадную оплошность, ведь мы не бросили эту тему! Сложно представить распознавание без нейронных сетей, поэтому мы расскажем о том, как мы запустили 8-битные...

[Перевод] Почему так сложно извлекать текст из PDF? Перевод статьи с сайта компании FilingDB, составляющей базу данных из документации европейских компаний Согласно распространённым представлениям, извлечение текста из PDF не должно быть такой уж сложной задачей. Ведь вот он, текст, прямо у нас перед глазами, и люди постоянн...

Google Lens теперь может автоматически переводить тексты на скриншотах Как сообщает 9to5Google, в Google Lens появилась новая удобная функция. Теперь вы можете сделать скриншот экрана с иностранным тестом и позволить Google Lens выполнить перевод без каких-либо промежуточных шагов. Новая функция доступна в пользовательском интерфейсе Googl...

"Яндекс" запустил собственный мессенджер. Приложение заменит "Яндекс.Чаты" В обновленном мессенджере можно вести каналы, а также совершать аудио- и видеозвонки. Также приложение позволяет расшифровывать голосовые сообщения и превращать их в текст при помощи технологии распознавания речи SpeechKit.

Сверточная нейронная сеть и ее интеграция в iOS (часть 1) Средства реализации. Различные алгоритмы машинного обучения интегрированы в множество высокоуровневых языков программирования. Наиболее популярным и быстро развивающимся из них является Python. TensorFlow — открытая программная библиотека для машинного обучения, разработа...

Cross-Fold Generation или как генерировать длинные последовательности с ruGPT-3 RuGPT-3 - AI-модель для русского языка, которая умеет писать тексты. Она может генерировать истории, стихи и новости, которые люди не могут отличить от настоящих. Похожая модель лежит в основе Балаболы от Яндекса. В этой статье мы описываем способ генерации длинных текстов б...

«Умные» очки научились показывать субтитры Google придумала, как переводить речь в текст и транслировать его прямо на линзы очков Функция распознавания речи в современных смартфонах позволяет людям с нарушениями слуха сделать взаимодействие с окружающим миром более комфортным, однако подобная модель общения будет раб...

Ранжирование текстов по похожести на опорные тексты при помощи модели TF-IDF в реализации GENSM Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это ...

Фигурка кошки под покраску Много текста не будет, в основном картинки.Начало процесса описано в статье "Как восстановить запоротую модель с помощью блокнота - опыт профессионального нуба". Вкратце: недостающая часть допечаталась, хвост пришлось долепить из моделайта.Далее модель склеена эпоксидкой, за...

Microsoft сократила задержку при рукописном вводе в Edge на 240% В сборках Microsoft Edge на канале Dev (и Canary) началось тестирование улучшений рукописного ввода, которые, как уверяет Microsoft, позволили сократить задержку на 240%. Это означает, что теперь пользователи Edge могут быстро и плавно рисовать в браузере, как показано ниже...

Huawei выпустила смарт-дисплеи линейки IdeaHub Smart Screen Компания Huawei официально представила новые «умные» панели большого размера линейки IdeaHub Smart Screen.В линейке Huawei оказалось три модели: IdeaHub S с разрешением Full HD (1920 х 1080 пикселей), IdeaHub Pro и IdeaHub Enterprise с разрешением 4K (3840 х 2160 пикселей). ...

Распознавание объектов на android с помощью TensorFlow: от подготовки данных до запуска на устройстве Обучение нейросети распознаванию образов — долгий и ресурсоемкий процесс. Особенно когда под рукой есть только недорогой ноут, а не компьютер с мощной видеокартой. В этом случае на помощь придёт Google Colaboratory, которая предлагает совершенно бесплатно воспользоваться GPU...

Прекрасное нововведение Google Фото: технология Google Объектив появилась на ПК Теперь пользователи сервиса Google Фото на ПК получили возможность распознавать текст на изображениях, который затем можно копировать и вставлять в любой место, благодаря добавлению поддержки технологии Google Объектив (Google Lens). Довольно давно Google Объектив досту...

51 миллион проданных распознаваний за 2019 год В компании Smart Engines (российский разработчик систем распознавания документов на основе искусственного интеллекта и компьютерного зрения) подвели итоги 2019 года.

[Из песочницы] Create ML в iOS Искусственный интеллект становится ближе с каждым годом, ещё вчера он был доступен только для ограниченного числа людей. Сегодня же мы можем сами создавать модели машинного обучения и использовать их в своих проектах. В этой статье мы познакомимся с инструментами Create ML...

Microsoft анонсировала новые функции для мобильных приложений Outlook, Lens и Teams Компания Microsoft анонсировала целый ряд новых функций, которые в обозримом будущем появятся в мобильных приложениях Outlook, Lens, Office и Teams на Android и iOS. Outlook и Cortana Outlook для iOS вскоре получит поддержку диалогового интерфейса для Cortana, который буде...

Машинное обучение. Нейронные сети (часть 2): Моделирование OR; XOR с помощью TensorFlow.js Статья является продолжением цикла статей, посвященных машинному обучению с использованием библиотеки TensorFlow.JS, в предыдущей статье приведены общая теоретическая часть обучения простейшей нейронной сети, состоящей из одного нейрона: Машинное обучение. Нейронные сети (ча...

Маленький и быстрый BERT для русского языка BERT – нейросеть, способная весьма неплохо понимать смысл текстов на человеческом языке. Впервые появивишись в 2018 году, эта модель совершила переворот в компьютерной лингвистике. Базовая версия модели долго предобучается, читая миллионы текстов и постепенно осваивая язык, ...

ScreenOCR — бесплатное приложение для распознавания текста на фото Мгновенный перевод, копирование и экспорт в TXT-файл.

[Перевод] Имитация рисования от руки на примере RoughJS RoughJS это маленькая (<9 КБ) графическая библиотека JavaScript, позволяющая рисовать в эскизном, рукописном стиле. Она позволяет рисовать на <canvas> и с помощью SVG. В этом посте я хочу ответить на самый популярный вопрос о RoughJS: как это работает? Немного ист...

В iOS 14.5 можно разблокировать iPhone с помощью Apple Watch, добавлена поддержка контроллеров Xbox Series X и PlayStation 5 Постоянное ношение масок на лице в эпоху пандемии коронавирусной инфекции усложняет использование систем биометрической идентификации пользователей на основе распознавания лица. Так как лицо в значительной степени закрыто маской, система Face ID не может распознать пользоват...

В iPadOS 14 появилось распознавание рукописного ввода. Как это работает Система распознавания рукописного ввода в Newton MessagePad в начале 90-х была гордостью и позором Apple Computer. Первые её версии вызывали смех и отбили охоту связываться с «персональными цифровыми ассистентами» у многих. Рукописный ввод вскоре починили, но это ...

Google Объектив оказался невероятно популярным. Его уже скачали более 500 млн раз Приложение Google Lens или Google Объектив было выпущено в магазине Google Play в июне 2018 года. За последние два с половиной года это приложение было скачано более 500 миллионов раз в официальном магазине приложений Google. Google Объектив позволяет распознавать предм...

Машинное обучение. Нейронные сети (часть 3) — Convolutional Network под микроскопом. Изучение АПИ Tensorflow.js В предыдущих статьях, использовался только один из видов слоев нейронной сети – полносвязанные (dense, fully-connected), когда каждый нейрон исходного слоя имеет связь со всеми нейронами из предыдущих слоев. Чтобы обработать, например, черно-белое изображение размером 24x24,...

Яндекс добавил автоматический перевод любых англоязычных видео в «Яндекс.Браузере» Технологии IT/Игры 07.09.2021, 16:00 Яндекс добавил автоматический перевод любых англоязычных видео в «Яндекс.Браузере» Благодаря технологии пользователи смогут смотреть ролики на Youtube и других сервисах на английском языке с закадро...

Canon подтверждает, что EOS R3 — не флагманская камера Канал Sonder Creative опубликовал интервью с представителем компании Canon, снятое на выставке фотографии в Бирмингеме. Представитель Canon подтвердил, что беззеркальная камера Canon EOS R3 не является флагманской моделью. Превосходя другие модели беззеркальной линейки ...

Интересные материалы: 05.08 В новом дайджесте iOS 14 и IDFA и мобильная атрибуция трафика, распознавание текста и единственное, что может сделать вас сеньором.

Распознавание речи: очень краткий вводный курс Рассказать неспециалисту максимально просто о работе компьютерного распознавания речи и преобразовании её в текст — задача почти непосильная. Ни один рассказ об этом не обходится без сложных формул и математических терминов. Мы попробуем максимально понятно и немного упрощ...

[Перевод] OCR для PDF в среде .NET — как извлечь текст из недоступных для поиска PDF документов Извлечение текста — одна из популярных задач обработки PDF документов. Вам потребуется извлечь текст из PDF, чтобы: проиндексировать документ для полнотекстового поиска распарсить некоторые данные (например, названия и цены товаров в прайс-листе) выделить, удалить или замен...

Особенности создания синтаксического анализатора русского текста В данной статье приводится краткое описание основных особенностей, проблем и сложностей, которые автору пришлось решать при реализации программы морфологической и синтаксической обработки текстов на русском языке.Была поставлена задача создания программы морфологической и си...

Как преобразовать текст в алгебру: примеры В предыдущей статье было разработано представление знаковых последовательностей полиномами матричных единиц на примере языкового текста. Текст превращается в алгебраический объект. С текстом можно совершать все алгебраические операции, необходимые для структуризации -- вычис...

[Перевод] Краткий обзор статьи “CoAtNet: объединение свертки и внимания под любые объемы данных” Ссылка на статьюКод пока недоступен.Это еще одна статья о сочетании сверточных нейронных сетей (CNN) и внимания (attention) для решения задач компьютерного зрения. Авторы (из Google Research) объединяют depthwise свертки с self-attention, вертикально накладывая друг на друга...

iPadOS 14: новые функции, созданные специально для iPad Особый дизайн приложений для iPad, упрощённое взаимодействие с операционной системой с помощью компактных интерфейсов Siri, поиска и звонков, новые возможности работы с Apple Pencil и рукописным вводом текста, а также множество других функций.

FineReader, Tesseract и EasyOCR или нужно ли срочно менять инструмент для OCR По сравнению со старшими товарищами, EasyOCR очень молодой проект, но с большими амбициями. В статье приводится сравнение качества работы, удобства работы, особенности установки и производительности трёх инструментов.Одна из популярных задач в аудиторской практике – рас...

Карта бизнес-процессов маркетплейса Разработку платформы для e-commerce проекта нужно всегда начинать с описания бизнес-процессов, и лишь потом переходить к IT-реализации. IT — это необходимое техническое решение, которое позволяет автоматизировать все описанное. Есть часть важных процессов, которые являю...

iPad OS 14: Что нового в iPad и iPad Pro? #WWDC2020 Компания Apple представила операционную систему iPadOS 14 с новым дизайном и функциями, которые используют все уникальные возможности iPad и большого дисплея Multi-Touch. В iPadOS 14 полностью переработаны интерфейсы для входящих телефонных звонков и звонков FaceTime, для р...

Django Rest Framework для начинающих: создаём API для чтения данных (часть 1) Меня зовут Стас Гаранжа, я выпускник курса «Python-разработчик» в Яндекс.Практикуме. Я хочу помочь начинающим разработчикам, которые приступили к изучению Django Rest Framework (DRF) и хотят разобраться, как устроен этот фреймворк. Я готовлю цикл статей, в которых расскажу о...

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях? Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить...

Популярное приложение Google Объектив изменилось: теперь упор делается на анализе фотографий и скриншотов на вашем устройстве Как сообщает 9to5Google, компания Google выпустила обновление для популярного приложения Google Lens, после установки которого меняются основные принципы использования приложения. Если раньше акцент делался на анализе того, что попадает в объектив видоискателя в реально...

Ученые впервые создадут интерактивную базу древнеславянских текстов с помощью технологий искусственного интеллекта Корпус - это структурированная база данных языка, информационно-справочная система, основанная на собрании текстов на определенном языке в электронной форме. Он представляет собой подобранную и особым образом обработанную (размеченную) совокупность текстов, которые использую...

[Перевод] Наглядно о том, как работает свёрточная нейронная сеть К старту курса о машинном и глубоком обучении мы решили поделиться переводом статьи с наглядным объяснением того, как работают CNN — сети, основанные на принципах работы визуальной коры человеческого мозга. Ненавязчиво, как бы между строк, автор наталкивает на размышления о ...

Состоялся публичный релиз библиотеки Microsoft DirectML В каждом из миллиарда устройств с Windows 10 по всему миру есть графический процессор, позволяющий ускорять задачи искусственного интеллекта. Это могут быть новые возможности в приложениях для редактирования фотографий или даже инструменты, помогающие с минимальными усилиям...

Голосовые сообщения россиян во «ВКонтакте» научились автоматически переводить в текст Соцсеть «ВКонтакте» начала тестировать распознавание голосовых сообщений на русском языке. По сути, такие сообщения научились автоматически переводить в текст.

[Перевод] Символьная математика, наконец, начинает поддаваться нейросетям Переведя на язык машин часть сложных математических уравнений, исследователи создали систему с искусственным интеллектом, надеясь, что она даст ответы на ещё более сложные вопросы Переводя задачи символьной математики в древовидные структуры, мы, наконец, можем заставить не...

Искусственный интеллект распознает паспорта РФ В Университете Иннополис разработали сервис по распознаванию данных с изображений паспорта РФ с помощью ИИ.

Рукописное заявление Стива Джобса о приёме на работу продали за 343 000 долларов, а версию в виде NFT за 12 ETH Рукописное заявление о приёме на работу Стива Джобса, датированное 1973 годом, снова перепродали. Если буквально в марте за него отдали 222 400 долларов, то на сей раз сумма составила уже 343 000 долларов.  Однако в этот раз было и кое-что оригинальное. Вмест...

[Перевод] AutoVIML: Автоматизированное машинное обучение Перевод статьи подготовлен специально для студентов курса «Промышленный ML на больших данных»Машинное обучение обладает преимуществом обучения алгоритмов, которые автоматически улучшаются, используя полученный опыт. Существует N различных алгоритмов и методов машинного обуче...

Перевод аудиофайлов в текст при помощи Google Translate Расшифровка звука в письменную форму пригодится студентам, которые записывают лекции на диктофон, блогерам, журналистам, а также онлайн-коучам. Раньше Google Translate воспринимал только четкую диктовку коротких фраз, и не мог помочь для перевода или транскрибации живой че...

[Перевод] Анимации градиентного спуска и ландшафта потерь нейронных сетей на Python Во время изучения различных алгоритмов машинного обучения я наткнулся на ландшафт потерь нейронных сетей с их горными территориями, хребтами и долинами. Эти ландшафты потерь сильно отличались от выпуклых и гладких ландшафтов потерь, с которыми я столкнулся при использовании ...

Планшеты HUAWEI MatePad Pro и MatePad M6 получили улучшенный пользовательский интерфейс EMUI 11 Huawei Consumer Business Group рассказала о том, что улучшенный пользовательский интерфейс EMUI 11 стал доступен российским пользователям планшетов HUAWEI MatePad Pro и HUAWEI MediaPad M6. EMUI 11 получил получила усовершенствованный многооконный режим с плавающей панелью у...

Планшеты HUAWEI MatePad Pro и MediaPad M6 получили улучшенный пользовательский интерфейс EMUI 11 Huawei Consumer Business Group рассказала о том, что улучшенный пользовательский интерфейс EMUI 11 стал доступен российским пользователям планшетов HUAWEI MatePad Pro и HUAWEI MediaPad M6. EMUI 11 получил получила усовершенствованный многооконный режим с плавающей панелью у...

Учиться, учиться, и ещё раз учиться? TLDR: крохотные модельки обошли модные графовые нейронки в предсказании свойств молекул. Код: здесь. Берегите Природу. ФОТО: Андерс Хеллберг для Wikimedia Commons, модель — Грета Тунберг Необученная графовая свёрточная нейронная сеть [1] (uGCN) со случайной инициализацией ...

CameraX+ML Kit для распознавания номера карты в действии Привет, меня зовут Виталий Беляев, я Android-разработчик в red_mad_robot. В этой статье я расскажу про опыт интеграции CameraX с ML Kit на замену библиотеки card.io, и что в итоге из этого получилось. Читать далее

Сбер запускает сервис речевых технологий До конца года доступ к сервису, разработанному командой SberDevices, будет бесплатным.SmartSpeech можно использовать на сайтах, в приложениях или умных устройствах для озвучивания контента и команд или голосового ввода. Также используемые в сервисе технологии синтеза и распо...

Искусственный интеллект освоил Библию и взялся изрекать мрачные пророчества Джордж Дюрандаль, разработчик и специалист по квантовым наукам, в исследовательских целях обучил искусственный интеллект писаниям из Библии. Он взял типовую нейросеть для глубокого распознавания текста и в качестве исходных данных дал ей Библию короля Якова. Не современную в...

[Перевод] Неожиданное влияние текстов среднего размера на производительность PostgreSQL В схеме любой базы данных, наверняка, будет множество текстовых полей. Я, для целей этой статьи, разделил текстовые поля на три категории: Маленькие тексты. Имена и фамилии людей, заголовки страниц, имена пользователей, адреса электронной почты и прочее подобное. Обычно на...

Сбербанк привлек осужденных к обучению искусственного интеллекта Как сообщает издание «Коммерсантъ», Сбербанк заключил соглашение с Федеральной службой исполнения наказаний (ФСИН) о совместной работе над системой искусственного интеллекта (ИИ). По условиям соглашения, осужденные будут принимать участие в обучении системы ...

«Райффайзенбанк» рассказал, что ускорил сверку документов в три-шесть раз за счёт приложения для распознавания текста Сотрудники тратили на сверку до часа, программа — до 10 минут, подсчитали в компании.

[Из песочницы] Web2Text: глубокое структурированное извлечение содержимого web-страницы Привет, Хабр! Представляю вашему вниманию перевод статьи "Web2Text: Deep Structured Boilerplate Removal" коллектива авторов Thijs Vogels, Octavian-Eugen Ganea и Carsten Eickhof. Веб-страницы являются ценным источником информации для многих задач обработки естествен...

Исследователи нашли расизм и сексизм в алгоритмах для распознавания лиц Новое исследование показало, что большинство алгоритмов для распознавания лиц в мире предвзяты в отношении таких характеристик, как возраст, пол и раса. Это значит, что технология гораздо чаще ошибается при распознавании, например, африканца, чем при распознавании белого евр...

Распознавание мяча в волейболе с OpenCV и Tensorflow После первого опыта распознавания спортивных движений у меня зачесались руки сделать что-нибудь еще в этом направлении. Домашняя физкультура уже казалась слишком мелкой целью, так что я замахнулся на игровые виды спорта. Применение искусственного интеллекта к спорту — недав...

Тинькофф запустил сервис речевой аналитики для бизнеса Платформа речевой аналитики Тинькофф работает на базе технологий распознавания и синтеза речи Tinkoff VoiceKit. Искусственный интеллект позволяет автоматизировать оценку работы колл-центров.

Простейший голосовой помощник на Python Для создания голосового помощника не нужно обладать большими знаниями в программировании, главное понимать каким функционалом он должен владеть. Многие компании создают их на первой линии связи с клиентом для удобства, оптимизации рабочих процессов и наилучшей классификаци...

Адаптация подхода с применением сжатия zlib для отсеивания некачественных текстов разной длины Недавно Сбер в статье Всё, что нам нужно — это генерация предложил интересный подход для отсеивания некачественных текстов (технического мусора и шаблонного спама). Но разве коэффициент сжатия zlib на качественных текстах не имеет нелинейной зависимости от длины сжимаемого т...

Устройство дистанционного измерения температуры и распознавания лиц людей в медицинских масках Smartec Новый комплекс Smartec STX-IP21TM выполняет бесконтактное измерение температуры тела одновременно с распознаванием лиц людей в потоке для своевременного выявления зараженных вирусными инфекциями. Устройство в реальном времени измеряет температуру десятков человек в кадр...

[Из песочницы] Новый способ изучения психотропных веществ с помощью ЭЭГ и нейронных сетей В данной статье мы хотели бы поделиться результатами исследования, суть которого заключается в расшифровке паттернов нейрональной активности на фоне действия психотропных веществ с помощью алгоритмов глубокого обучения. При планировании и реализации работы мы руководствовали...

Жесты для работы с текстом на iPhone и iPad, о которых вы могли не знать С выходом iOS 13 и iPadOS 13 появилось несколько новых интересных способов работы с текстом. Возможно, вы все еще не знаете как использовать жесты для выбора, вырезания, копирования, вставки, отмены и повтора. Кроме того, можно легко перемещать курсор в нужное вам место и бы...

Работников Canon в Китае заставляют улыбаться камере с распознаванием лиц. Только так их допустят к работе Технологическая компания Canon установила камеры с технологией «распознавания улыбки» на базе искусственного интеллекта (ИИ) в офисах своей китайской дочерней компании Canon Information Technology. Сотрудники должны улыбаться в камеру, пока алгоритм не решит, что они выглядя...

Верховный суд Китая запретил частным компаниям использовать распознавание лиц Верховный суд Китая вынес решение, касающееся использования технологии распознавания лиц, признав право людей отказывать в несанкционированном сборе данных распознавания лиц коммерческими организациям

Как выстроить процесс интеллектуальной обработки документов с помощью RPA: опыт UiPath Не существует компаний, в которых не было бы работы с документами. И это — кропотливый, рутинный, но очень важный процесс. Люди хотят получать зарплату вовремя, а поставщики и контрагенты своевременную оплату за свои услуги. Бухгалтеру в компании регулярно приходится проводи...

[Из песочницы] Реализация скелетной анимации для трёхмерных моделей Здравствуйте! В данный момент на Хабре существует большое количество статей, посвящённых компьютерной графике и реализации различных эффектов, однако текстов на тему реализации скелетной анимации (особенно "с нуля") достаточно немного. Постараюсь восполнить этот пр...

Нейросети. Куда это все движется Статья состоит из двух частей: Краткое описание некоторых архитектур сетей по обнаружению объектов на изображении и сегментации изображений с самыми понятными для меня ссылками на ресурсы. Старался выбирать видео пояснения и желательно на русском языке. Вторая часть состоит...

iOS 14.5 даёт больше свободы, пользователи хвалят Apple Apple выпустила свежие бета-версии iOS 14.5 и iPadOS 14.5, которые содержат новые функции, такие как добавление распознавание 5 новых языков при рукописном вводе на iPad с Apple Pencil. В iOS 14 в этом году Apple наконец-то дала возможность пользователям возможность изм...

Мелкая питонячая радость #14: ботнеты, распознавание текстов и генератор статических сайтов Самое поразительное из того, что я увидел за последние 2 недели — тулкит на Python для создания ботнетов. Конечно же, он написан для исследовательских и учебных целях, но, тем не менее, эта штука дает энтузиастам компьютерной безопасности доступ к реализации целого  наб...

Как написать симпатичный чейнджлог: опыт Авито Привет! Меня зовут Гера, я продуктовый редактор в Авито. Пишу тексты для интерфейсов и рассылок, а ещё — чейнджлоги для Google Play и App Store. Это тексты, в которых рассказывается, что появилось в новой версии приложения. По-английски их ещё иногда...

Xiaomi выпустила компактную клавиатуру с функцией голосового ввода Компания Xiaomi выпустила клавиатуру компактных размеров под названием Mi Wu Intelligent Voice Keyboard.Устройство запускается через площадку коллективного финансирования компании. Стоимость в рамках краудфандинга составляет $40, но после завершения кампании ценник вырастет ...

Новая статья: 10 самых полезных мобильных приложений для студента Вот и завершились летние каникулы. Это значит, что беззаботная жизнь студенческой братии вновь вернётся в свой прежний облик и вовлечёт в водоворот лекций, семинаров, лабораторных и курсовых работ, научных исследований, экзаменов, зачётов и прочих учебных процессов. Денёчки ...

Программистское везение Более двух десятков лет назад мы разрабатывали устройство, передающее и принимающее данные, используя телевизионный сигнал. Это сейчас все избалованы гигагерцами и гигабайтами, а тогда, имея компьютер типа IBM/PC-AT, на таких скоростях можно было работать только с помощью вс...

Amazon выпустила открытую библиотеку для создания ИИ-моделей несколькими строками кода Благодаря AutoGluon можно создавать модели искусственного интеллекта, использующие изображения, текст и табличные наборы данных, путём написания небольшого количества строк кода.Создание таких приложений - задача непростая, поскольку разработчики должны знать, как настраиват...

Lenovo Xiaoxin Panda: МФУ с поддержкой облачной печати и функцией распознавания ошибок в тексте за $133 Китайский производитель электроники Lenovo анонсировал новое многофункциональное устройство (МФУ).

Из России с компьютерным зрением: будущее – это телеприсутствие Говорят, что мир становится все меньше. С другой стороны, поскольку сегодня бизнес часто ведется на больших расстояниях, а многие люди живут далеко от своих родных и друзей, планета всё еще кажется огромной. Возможность проецировать свое присутствие за тысячи километров може...

DDD, CQRS, Event-Driven, модель акторов и микросервисы Хочу поделиться своим опытом реализации микросервисной архитектуры поверх actor-model фреймоворков, таких как AKKA и Microsoft Orleans. Моя гипотеза: если использовать один стек для реализации микросервисов, то можно: Существенно снизить сложность разработки и объем кода У...

Grammarly запустил «детектор тона» для смартфонов, который определяет предполагаемое воздействие текста на читателя Компания Grammarly, которая разрабатывает онлайн-сервис для помощи в написании текстов на английском языке, сообщила про запуск детектора тона для мобильных устройств. Теперь эта функция будет также доступна для пользователей iPhone, iPad и мобильных устройств с ОС Android. ...

Где логика?! История тестирования одного микросервиса Эта статья — расшифровка доклада Дениса Кудряшова, QA-инженера Leroy Merlin, с конференции QA Meeting Point 2020. Денис рассказал, как столкнулся со сложной логикой, реализованной в сервисе, применил подход Control Flow Testing, и что из этого вышло. Из текста вы узнаете, мо...

Microsoft Office 2021 выйдет 5 октября; Office LTSC 2021 уже доступен Microsoft объявила о релизе пакета приложений Office LTSC 2021 с удлинённым сроком поддержки, который предназначен для коммерческих клиентов и государственных учреждений. Вместе с этим компания сообщила, что релиз потребительской версии Office 2021 состоится 5 октября 2021 ...

Open Source синтез речи SOVA Всем привет! Ранее мы выкладывали статью про наше распознавание речи, сегодня мы хотим рассказать вам о нашем опыте по созданию синтеза речи на русском языке, а также поделиться ссылками на репозитории и датасеты для свободного использования в любых целях. Если вам интересн...

Клетка и организм — рекуррентные нейросети? Исходно нейросети были введены в практику как попытка смоделировать для решения прикладных задач работу нейронов в нервной системе животных. По всей видимости аналогичные алгоритмы распространяются "вглубь" клеток и реализованы с помощью клеточной машинерии даже внутри самых...

Подборка полезных расширений Google Chrome для веб-мастеров, оптимизаторов и копирайтеров Обновленная подборка из бесплатных браузерных плагинов, которые помогут работать эффективнее. Распознавание текста на картинках, быстрый SEO-анализ, проверка ссылок и другое.

7 инструментов для распознавания текста онлайн и офлайн Эти сайты и программы помогут извлечь текстовое содержимое изображений и бумаг, чтобы вам было удобнее с ним работать.

Covid fake FAQ___draft_final_4 (окончательное доказательство) Как говорил доктор Хаус: Все врут.Я решил написать данный текст после прочтения недавнего поста на хабре от "скептика" а так же после длительных дискуссий с разными людьми, которые уверены что все это фейк и даже больше. В данном тексте я не оцениваю политизированность темы,...

Samsung позволит набирать текст с помощью селфи-камеры Экспериментальная лаборатория C-Lab компании Samsung представила технологию SelfieType — с её помощью можно использовать фронтальную камеру для набора текста на любой горизонтальной поверхности.

Языковые модели как двигатель прогресса: необычные применения для GPT-3 В начале лета разработчики из OpenAI представили языковую модель GPT-3, созданную для написания связного текста на основе заданного материала. Её обучали на 570 гигабайтах содержимого веб-страниц, википедии и художественной литературы, что почти в 15 раз превышает объем да...

Как я сжимал модель fastText для реальной задачи в 80 раз в 2021 году FastText — это отличное решение для предоставления готовых векторных представлений слов, для решения различных задач в области ML и NLP. Но основным недостатком данных моделей является, то что на текущий момент обученная модель FastText на русскоязычном корпусе текстов Викип...

Я 20 лет наслаждаюсь разнообразием архитектур и хочу поделиться мыслями Сначала хотел написать комментарий к статье "Я десять лет страдал от ужасных архитектур в C#...", но понял две вещи: Слишком много мыслей, которыми хочется поделиться. Для такого объёма формат комментария неудобен ни для написания, ни для прочтения. Давно читаю...

Яндекс запустил генератор текстов «Балабоба» Яндекс запустил генератор текстов «Балабоба». Сервис работает на основе языковой модели YaLM (Yet another Language Model) и умеет дописывать за пользователем тексты на любую тему.

Baidu и Samsung Electronics готовы начать выпуск ускорителей искусственного интеллекта Китайский гигант интернет-поиска Baidu и южнокорейская компания Samsung Electronics, располагающая передовым полупроводниковым производством, объявили, что разработка первого ускорителя искусственного интеллекта Baidu KUNLUN завершена. Серийный выпуск Baidu KUNLUN начне...

Дообучаем готовую нейросеть для классификации данных В прошлой статье мы научились классифицировать данные без разметки с помощью понижения размерности и методов кластеризации. По итогам получили первичную разметку данных и узнали, что это картинки. С такими начальными условиями можно придумать что-то более серьёзное, например...

Несколько советов для быстрого набора текста на iPhone. Часть 2 В нашей недавней статье мы рассказали о 5 советах, как ускорить набор текста. Но в дополнение к ней хотелось бы отметить ещё 5 очень полезных и интересных функций, о которых Вы, возможно, не знали и которые помогут Вам набирать сообщения и текст на iPhone быстрее и эффективн...

Служба Microsoft Azure Speech научилась оценивать акцент говорящего Служба распознавания речи в текст Azure Speech научилась оценивать акцент говорящего. Microsoft рассматривает эту функцию в том числе как сервис для повышения точности передачи материала в рамках функции PowerPoint Presenter Coach. Подробнее об этом читайте на THG.ru.

Россиянам рассказали, как распознать мошеннический сайт Глава департамента корпоративного бизнеса разработчика антивирусных программ ESET Антон Пономарев поделился с россиянами несколькими способами распознавания мошеннических сайтов.

Сбербанк привлек осужденных к обучению искусственного интеллекта Как сообщает издание «Коммерсантъ», Сбербанк заключил соглашение с Федеральной службой исполнения наказаний (ФСИН) о совместной работе над системой искусственного интеллекта (ИИ). По условиям соглашения, осужденные будут принимать участие в обучении системы...

[Из песочницы] Ансамбли нейронных сетей с PyTorch и Sklearn Нейронные сети довольно популярны. Их главное преимущество в том, что они способны обобщать довольно сложные данные, на которых другие алгоритмы показывают низкое качество. Но что делать, если качество нейронной сети все еще неудовлетворительное? И тут на помощь приходят анс...

[Перевод] Выделение и CSS Навык выделения текста и других объектов сформировался у пользователей компьютеров много лет назад. Мы выделяем содержимое веб-страниц по разным причинам. Возможно, нужно скопировать текст и где-то его процитировать, возможно — кому-то просто легче читать текст, выделяя его ...

Huawei судят за незаконное использование технологий обработки изображения в своих смартфонах Компания Cedar Lane Technologies подала в суд на известного производителя смартфонов Huawei, в котором говорится о нарушении сразу нескольких патентов, связанных с обработкой изображений. Более того, факты нарушения якобы присутствуют в большом количестве уже выпущенных...

Написал приложение для создания параллельных книг, которое вас удивит Здравствуй, читатель. Хотелось бы ненадолго отвлечь твое внимание от новостей и историй данной технической статьей. Поэтому пусть такой "кликбейтный" затравочный заголовок не вводит тебя в заблуждение. В этой статье я расскажу как сделать параллельную книгу, имея ...

[Из песочницы] Распознавание символов методом наименьшего расстояния Левенштейна В последнее время задача распознавания символов в прикладных программах не представляет особой сложности — можно использовать множество готовых OCR-библиотек, многие из которых доведены почти до совершенства. Но все же иногда может возникнуть задача разработать свой алгоритм...

[Перевод] Ковыряемся в лидаре iPad 11 Pro Распознавание трехмерных объектов в Apple iPad 11 Pro, оснащенном лидаром, стало более глубоким и детализированным. Для этого также используются ToF-камеры с разными технологиями измерения дальности положения точки. Apple инициировала гонку использования лидаров в различн...

Baidu и Samsung Electronics готовы начать выпуск ускорителей искусственного интеллекта Китайский гигант интернет-поиска Baidu и южнокорейская компания Samsung Electronics, располагающая передовым полупроводниковым производством, объявили, что разработка первого ускорителя искусственного интеллекта Baidu KUNLUN завершена. Серийный выпуск Baidu KUNLUN начне...

Вставка текста на Mac без сохранения форматирования (стиля источника) Частенько бывает так, что копируя какую-нибудь информацию из браузера в любое приложение на macOS, вставляется не только исходный текст которым мы хотим оперировать, но и стиль форматирования. Это дико раздражает, потому как необходимо принимать дополнительные меры по подгон...

Безопасность iOS-приложений: гайд для новичков Привет! Меня зовут Гриша, я работаю application security инженером в компании Wrike и отвечаю за безопасность наших мобильных приложений. В этой статье я расскажу про основы безопасности iOS-приложений. Текст будет полезен, если вы только начинаете интересоваться безопасност...

DAM узнает его из тысячи: как в систему управления цифровыми активами внедрили распознавание лиц Создатели Picvario усовершенствовали собственную DAM-разработку, внедрив решение по распознаванию лиц на основе искусственного интеллекта.

[Перевод - recovery mode ] Понимание LDAP-протокола, иерархии данных и компонентов записей Введение LDAP, или Lightweight Directory Access Protocol, является открытым протоколом, используемым для хранения и получения данных из каталога с иерархической структурой. Обычно используемый для хранения информации об организации, ее активах и пользователях, LDAP является ...

Samsung научила смартфоны распознавать набор текста на несуществующей клавиатуре Samsung анонсировала новые проекты в рамках программы C-Lab, которые детально покажет на выставке CES 2020. Среди них инструмент для распознавания набора текста с помощью несуществующей клавиатуры, интеллектуальный маркер и датчик для отслеживания ультрафиолетового излучения...

[Перевод] Результаты голосования комитета C++ по асинхронному программированию Данный текст является переводом недавнего поста Бена Крейга - одного из членов комитета С++. TL;DR для нетерпеливых: Networking TS/Asio (P2444) не получает общего одобрения комитета, модель Senders/Receivers (P2300) становится основным направлением развития асинхронного прог...

Приложение PlantSnap и платформа Snapchat становятся партнерами PlantSnap, самое высокотехнологичное, универсальное и точное приложение для распознавания растений и обмена информацией в социальных сетях, вошло в число партнеров платформы SnapchatScan, предоставляющей удобные и полезные функции для работы с камерой Snapchat. Отныне пользо...

Видеообзор нового монохромного МФУ Xerox AltaLink B8170 AltaLink B8170 — новое монохромное МФУ компании Xerox является флагманом офисной серии Xerox AltaLink, предназначенной для компаний с большим документооборотом, где количество пользователей заметно превышает количество печатных устройств. Устройство обладает широкими возможн...

Устройство дистанционного измерения температуры и распознавания лиц людей в медицинских масках Smartec Новый комплекс Smartec STX-IP21TM выполняет бесконтактное измерение температуры тела одновременно с распознаванием лиц людей в потоке для своевременного выявления зараженных вирусными инфекциями. Устройство в реальном времени измеряет температуру десятков человек в кад...

Smart Engines окончательно решили задачу распознавания паспорта Научная компания Smart Engines решила последнюю фундаментальную проблему при распознавании паспорта РФ с помощью технологий искусственного интеллекта. Именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания паспорта РФ на уровн...

Искусственный интеллект в области юриспруденции. Статья 3 Введение Мы продолжаем цикл статей на тему юридического искусственного интеллекта, аспектов его разработки и перспектив практического применения на отечественном рынке. В предыдущих публикациях мы неоднократно говорили, что, по нашему мнению, разработка Legal AI может быть о...

[Перевод] ALBERT — облегченный BERT для самообучения языковым представлениям С тех пор как в 2018 году был представлен BERT, исследования в области обработки естественного языка охвачены новой парадигмой: использованием больших объемов существующего текста для предварительного обучения параметров модели на основе самообучения (self-supervision), не т...

Нейрозапятые, или как мы оставили своих редакторов без работы (ну почти) Всем привет, меня зовут Владислав Соболев – ML-инженер в компании “БАРС Груп”. Сегодня я хотел бы рассказать о том, зачем и как мы расставляем знаки препинания в текстах, сравним аналоги, и посмотрим на то, как устроена работа инструмента, который мы написали, чтобы обучать ...

Как мы распознаем средства индивидуальной защиты Наверное, вам всю жизнь было очень интересно, как натренировать нейронную сеть распознавать людей в касках и оранжевых жилетах! Нет? Но мы все равно расскажем. Нас зовут Татьяна Воронова и Эльвира Дяминова. Мы занимаемся анализом данных в компании «Центр 2М», много работаем...

[Из песочницы] Алгоритм распознавания номера на изображении с низкой вероятностью ошибки второго рода В индустрии существует целый ряд кэйсов, требующих распознавания номера по фотографии (scene number recognition). Часто требуемым условием для алгоритма распознавания является низкое значение ошибки второго рода, а именно случаи, когда распознается неверный номер. В качеств...

Люди и компьютеры видят трехмерные объекты одинаково Исследователи стремятся к тому, чтобы искусственный интеллект был в некоторых аспектах похож на естественный. Теперь в искусственных нейросетях нашли паттерны сигналов, до жути схожие с происходящим в мозге Ученые давно пытаются научить искусственный интеллект видеть так же ...

Трояны и бэкдоры в кнопочных мобильных телефонах российской розницы Немалое количество простых кнопочных телефонов, присутствующих в российских магазинах, содержат нежелательные недокументированные функции. Они могут совершать автоматическую отправку СМС-сообщений или выходить в интернет для передачи факта покупки и использования телефона (п...

[Перевод] Как работают двоичные нейронные сети, и почему они будут популярными в 2020-м Нейросети – штука классная, однако их потенциал до сих пор ограничивают стоимость и энергия; с этим, возможно, помогут справиться двоичные нейросети Концепция нейросетей впервые появилась более 40 лет назад, когда учёные экспериментировали с математическим моделированием ф...

10 полезных приложений для студентов и школьников Летние каникулы закончились и несмотря на коронавирус дети отправились в школу, а подростки в колледжи, институты и университеты. Что будет дальше с формой обучения все еще не ясно и, возможно, всех вернут обратно домой на дистанционное обучение совсем скоро. В любом случае...

Тинькофф Мобайл запустил сервис автоматической записи и расшифровки звонков в текст Сервис позволяет сохранять все входящие и исходящие телефонные звонки в аудио- и текстовом форматах в приложении Тинькофф Мобайл.

Зачем нам потребовалось написать свою реализацию MRCP-сервера. Часть 1 Привет, Хабр! Сегодня мы хотели бы поделиться кейсом создания собственного MRCP-сервера. Это протокол передачи данных, используемый серверами для предоставления различных услуг (таких как распознавание речи и синтез речи) для своих клиентов. MRCP опирается на другие протокол...

Архитектура интерпрайз-приложений может быть другой Меня раздражает традиционная архитектура бизнес-приложений — об этом я уже говорил. Я критикую — я предлагаю. Сейчас я расскажу, к чему меня привели поиски решений для проблем из предыдущей статьи. Мне нравится перебирать архитектурные концепции. Всю жизнь я пытаюсь найти ...

Как сервис Estimate помогает автоматизировать процесс оценки и узнать стоимость IT-проекта Как для бизнеса, так и для IT-компании оценка – один из самых важных этапов в начале работы над проектом. Бизнес готов сотрудничать с тем подрядчиком, который назовет стоимость объективно, прозрачно и быстро, в идеале – немедленно. При этом на рынке существует значительный ...

Парковка для ваших минусов С помощью этого текста, или его вариаций в устной или письменной форме, я лишаюсь на работе всех друзей. Это мой сознательный выбор. Вообще, я добрый и мягкий человек. Люблю телек смотреть, книжки читать, котов своих гладить, шашлыки жарить. Но это вне работы. А на работе ...

Зачем нужно писать от руки, когда везде используются клавиатуры? Письмо от руки полезно, поэтому оно вряд ли исчезнет из школьной программы Сегодня мало кто пишет тексты от руки, потому что это легче делать через смартфон или компьютер. Кажется, что скоро рукописные документы вообще исчезнут из нашей жизни и вся информация будет храниться...

Книга «Программируем с PyTorch: Создание приложений глубокого обучения» Привет, Хаброжители! Ян Пойнтер поможет разобраться, как настроить PyTorch в облачной среде, как создавать нейронные архитектуры, облегчающие работу с изображениями, звуком и текстом. Книга охватывает важнейшие концепции применения переноса обучения, модели отладки и исполь...

Microsoft исправит раздражающую ошибку левой кнопки мыши в Chrome и Edge В следующем году в Microsoft Edge начнется внедрение ряда новых функций в рамках следующей крупной версии браузера. Главным среди нововведений может стать новый интерфейс рукописного ввода / рисования, который будет разработан для пользователей пера и пользователей, которые ...

Названы 13 сервисов для работы с текстами и изображениями Пользователь vc.ru, владелец AMM digital, основатель OnTop Марат Минкин поделился списком онлайн-сервисов, благодаря которым на создание текстов и подбор или обработку фото у вас будет уходить меньше времени.

Разблокировка по лицу — теперь и в авто. Удобная функция появилась в Cadillac XT4 2021 В компактном кроссовере Cadillac XT4 образца 2021 модельного года появилась полезная функция, знакомая всем пользователям современных смартфонов: разблокировка по лицу. Как она работает — хорошо демонстрирует видеоролик ниже. Как видно, в верхнюю часть рамки двери...

[Перевод] «Привет, мир»: разбираем каждый шаг хэш-алгоритма SHA-256 SHA-2 (Secure Hash Algorithm), в семейство которого входит SHA-256, — это один самых известных и часто используемых алгоритмов хэширования. В тексте подробно покажем каждый шаг работы этого алгоритма на реальном примере. SHA-2 отличается безопасностью (его тяжелее взломать,...

Искусственный интеллект научили переводить сигналы человеческого мозга в текст с точностью 97% Команда исследователей Калифорнийского университета в Сан-Франциско под руководством нейрохирурга Эдварда Чанга успешно применила новый метод декодирования электрокортикограммы – записи ритмической электрической активности коры мозга с помощью электродов, наложенных непосред...

"Цифровой юрист" от "МегаФона" заменит 70% персонала "Цифровой юрист" разработан совместно с технологическим партнером "МегаФона" – компанией Nlogic. В основе экосистемы "Цифрового юриста" лежит нейросеть и технология оптического распознавания символов (OCR). Сервис предлагает три продукта для повышения эффективности бэк-офиса...

Предсказание будущего: нейрокомпьютерная модель распознавания речи Что есть речь человека? Это слова, комбинации которых позволяют выразить ту или иную информацию. Возникает вопрос, откуда мы знаем, когда заканчивается одно слово и начинается другое? Вопрос довольно странный, подумают многие, ведь мы с рождения слышим речь окружающих люде...

Представлен первый автоматический умный дверной замок Xiaomi Xiaomi регулярно выпускает новые продукты для умного дома. Так, сегодня компания представила свой первый автоматический умный дверной замок, который называется Xiaomi Automatic Smart Door Lock. Замок автоматически откроется при распознавании отпечатка пальца. Это избавл...

Deepfakes Lab: распознавание дипфейков и защита от них с помощью новейших технологий ИИ 27 ноября 2020 г., Москва — McAfee рассказала всё о дипфейках: как они создаются, как их распознать и как защититься от дипфейков с помощью новейших технологий ИИ.

Нейросеть научили распознавать речь по губам при помощи алгоритма распознавания записи голоса Hal 9000 прекрасно читал по губам, правда, по-английски Нейросети сейчас умеют многое, и постепенно их обучают все большему количеству умений. На днях стало известно о том, что объединенная команда исследователей из США и Китая смогла обучить нейросеть распознавать речь по...

Microsoft выпустила Office LTSC 2021 Microsoft объявила сегодня о выпуске Office LTSC 2021, новой бессрочной версии Office для коммерческих и государственных клиентов. Office 2021, новая потребительская бессрочная версия Office, также будет выпущена 5 октября, что также является датой выпуска Windows 11. Office...

Снятся ли телефонам с HMS электроовцы? Обзор функций и возможностей инструментов AI от Huawei Перерисовать человека в кота и наоборот, перевести надпись с китайского «на лету» и сделать подборку статей — эти и многие другие сценарии в мобильных приложениях стали возможны благодаря сервисам, использующим технологии искусственного интеллекта и решающим когнитивные зада...

Машинное обучение поможет разобраться в распознавании лиц Человек обладает способностью распознавать огромное количество лиц и интерпретировать различные выражения лица. Эта способность играет исключительно важную роль в процессе социального взаимодействия между людьми, однако сам механизм обработки и хранения этой сложной зрительн...

[Перевод] Как на Raspberry Pi запустить модель ML и сэкономить пространство одноплатника Представьте ситуацию: впереди выходные, а у вас есть достаточно нагруженная малинка и вы — ради эксперимента — хотите посмотреть, что ML умеет на мощностях RPi, но не хотите слишком перегружать машину, даже всей облегчённой версией TF. Что можно сделать? Мы уже писали о клас...

Обучение универсальной модели NLU c BERT и Multitask Learning В современной компьютерной лингвистике понимание смысла написанного или сказанного достигается с помощью моделей естественного языка (NLU). С постепенным ростом аудитории виртуальных ассистентов Салют встает вопрос об оптимизации наших сервисов, работающих с естественным яз...

Гетерогенные транзакции на примере Kafka vs. RDBMS Данный текст описывает общесистемные подходы, используемые при работе с брокером сообщений Kafka, и общие архитектурные подходы, применяемые при работе с системами, имеющими несовместимые транзакционные модели. Читать далее

[Перевод] Безопасное использование C++ От переводчика. Данный текст является переводом документа Safer Usage Of C++, выложенного в общий доступ командой Chromium/Chrome из компании Google. Текст активно обсуждался на Reddit, и команда PVS-Studio решила, что аудитории Habr-а может быть интересно познакомиться с ег...

Месяц с Onyx Boox Note Pro Хотя устройства с E-ink, позволяющие делать рукописные заметки и рисунки, существуют довольно давно, приемлемая задержка между касанием пера и появлением следа от него была достигнута сравнительно недавно (из известных это Sony DPT-S1/RP1 и reMarkable). Поскольку у меня, н...

Распознавание блюд в кафетерии банка В кафетерии Альфа-Банка в обеденный час-пик образуются большие очереди. Процесс обслуживания замедляется на линиях раздачи горячих блюд и в кассовой зоне. При помощи современных методов компьютерного зрения можно автоматизировать процесс определения списка блюд на подносе. Р...

Как мы работаем с логами (сбор, хранение, анализ при помощи Graylog) Всем привет! В этой статье мы хотим поделиться нашим опытом использования полезной платформы Graylog, которая ежедневно помогает собирать, надежно хранить и анализировать логи с десятков серверов, окутанных заботой нашей поддержки :)Это первая часть статьи, в которой мы расс...

[Перевод] Учебный проект на Python: интерфейс в 40 строк кода (часть 2) Демонстрация проекта Python с пользовательским интерфейсом никогда не была такой простой. С помощью Streamlit Framework вы можете создавать браузерный пользовательский интерфейс, используя только код Python. В этой статье мы будем создавать пользовательский интерфейс для п...

Копнем поглубже: сравниваем популярные алгоритмы оптимизации с менее известными. Часть 2 Еще раз здравствуй, Хабр! Меня зовут Мария Белялова, и я занимаюсь data science в мобильном фоторедакторе Prequel. Кстати, именно в нём и обработана фотография из шапки поста. Эта вторая статья в нашем цикле материалов про сравнение алгоритмов оптимизации для обучения ней...

Конкурс World & AI Data Challenge: начинаем решать задачу распознавания шрифта Брайля Технологии искусственного интеллекта и анализа данных всё стремительнее входят в нашу жизнь, они могут дать еще один шанс решению действительно важных для людей социальных задач, которые ранее не были реализованы. С этой целью центр цифрового развития АСИ организовал конкурс...

Business Intelligence на больших данных — наш опыт интеграции В вопросах производительности BI обычно приходится искать компромисс между скоростью работы аналитики и объемами данных, над которыми она реализована. Впрочем, существуют способы “убить двух зайцев” сразу, и сегодня я хочу поделиться нашим опытом интеграции Visiology с платф...

[Перевод] Программирование игры для embedded-устройства на ESP32: шрифты и система тайлов Начало: сборка, система ввода, дисплей. Продолжение: накопитель, аккумулятор, звук. Часть 7: Текст Завершив со слоем кода Odroid Go, мы можем приступить к созданию самой игры. Начнём с отрисовки на экране текста, потому что это станет плавным введением в несколько тем, ...

Restricted Boltzmann Machine — физика для рекомендательных систем В данной статье представлена математическая модель генеративной нейронной сети Restricted Boltzmann Machine для системы рекомендаций. Определяется откуда появился данный подход и почему он хорош в контексте систем рекомендаций. Также рассматривается топология нейросети и...

Простой граф знаний на текстовых данных Сегодня на простом примере рассмотрим – как провести краткий обзор неструктурированных данных в виде графа знаний.Для примера возьмем набор текстов из обращений с портала mos.ru. В данном случае, набор состоит из 90 тыс. обращений. Медианная длина обращений составляет 9 слов...

[Перевод] Как новая модель глубокого обучения делает возможной сегментацию изображений на пограничных устройствах К старту курса "Machine Learning и Deep Learning" мы решили поделиться переводом обзора AttendSeg — новой архитектуры нейронной сети, разработанной исследователями искусственного интеллекта из DarwinAI и Университета Ватерлоо, которая позволит выполнять сегментацию изображен...

Google Lens теперь автоматически переводить тексты на скриншотах Теперь можно сделать снимок экрана с иностранного языка и выполнить перевод без каких-либо промежуточных шагов благодаря приложению Google Lens. Новая захватывающая функция доступна в пользовательском интерфейсе Google Lens Screenshot UI для устройств под управлением Android...

Локализация своих скриптов на BASH Создание меню на BASH — задача сама по себе не сложная: "case тебе в руки и echo в спину". Решая её в очередной раз, мне захотелось добавить возможность отображать текст на других языках. Осталось решить, как сделать сам процесс локализации меню более удобным. Если...

Новая клавиатура Xiaomi распознаёт до 400 слов в минуту Компания Xiaomi представила умную клавиатуру с возможностью голосового ввода текста Mi Wu intelligent Voice Keyboard, которая предлагается на стадии предзаказа по цене около 40 долларов. Главной особенностью клавиатуры является возможность голосового ввода, производител...

Скрытая функция iOS 15: «Фоновые звуки» Компания Apple рассказала не обо всех нововведениях операционной системы iOS 15, но пользователи уже обнаружили новую функцию под названием «Фоновые звуки» (Background Sounds), которая позволит вам слышать расслабляющие звуки. Вы можете включить звуки дождя,...

Система под контролем: как автоматизировать интеграционные тесты Привет! Меня зовут Ксения Якиль. Я пишу core-сервисы на C и Go в бэкенд-отделе Badoo и Bumble. Наш бэкенд — это высоконагруженная распределённая система, обслуживающая пользователей по всему миру. Она оперирует большими массивами данных и делает всю ту магию, благодаря котор...

Создана информационно-поисковая система документов Великой Отечественной войны Система "ДокументыПобеды.рф" предоставляет возможность интеллектуального поиска информации по архивным документам за период 1941-1945 гг., благодаря чему изучение таких материалов становится удобнее и доступнее для широкой аудитории, что в свою очередь помогает пре...

Как я, специалист по ИИ, на ИИ-текст купился Захожу я сегодня на Хабр, и, под чашку чая, пролистываю статью «GPT-3 от OpenAI может стать величайшей вещью со времён Bitcoin». Если не читали – почитайте. Конец вызывает прямо-таки сильные эмоции. У меня они усугубились тем, что я относительно профессионально занимаюсь И...

Глубокие нейросети в компьютерном зрении: genesis for geeks Если вы в общих чертах представляете себе, как работает компьютерное зрение, но жаждете деталей, то эта статья для вас.Под катом — о том, как работают нейросети, какого рода алгоритмы используются в системах компьютерного зрения и насколько улучшилось качество распознавания ...

Структура холдинга Alphabet создала сервис для распознавания фейковых фотографий Программа, получившая название Assembler, предназначена для СМИ, которые с ее помощью смогут определять, был ли тот или иной снимок отретуширован. Среди прочего алгоритм может распознавать фейки, созданные с использованием нейросетей.

LinOTP — инсталляция и использование Привет, хочу поделиться своим опытом работы с LinOTP и привести пример надежной аутентификации с помощью связки LinOTP + FreeRADIUS и Wallix Bastion.LinOTP это гибкая опенсорс платформа корпоративного уровня для надежной аутентификации.Wallix Bastion - решение по управлению ...

Заявление Стива Джобса о приеме на работу продано на аукционе за 222 400 долларов Рукописное заявление Стива Джобса о приеме на работу продано на аукционе за 222 400 долларов. Документ датируется 1973 годом. Подробнее об этом читайте на THG.ru.

Как мы формируем консолидированную отчетность 25 компаний, 9 стран, 6 функциональных валют… Систему и процедуры подготовки отчетности легко можно было сделать сложными и дорогими. Но мы нашли простое с технической точки зрения решение, которое очень нравится нашим пользователям, а особенно специалистам по подготовке ко...

Понижаем барьеры на вход в распознавание речи Автоматическое распознавание речи (STT или ASR) прошло долгий путь совершенствования и имеет довольно обширную историю. Расхожим мнением является то, что лишь огромные корпорации способны на создание более-менее работающих "общих" решений, которые будут показывать...

Новое обновление MIUI 12 существенно упростит работу с текстом Изо дня в день мы видим все новые функции MIUI 12, последней версии фирменного пользовательского интерфейса Xiaomi. Нельзя отрицать, что это один из самых полных скинов, несмотря на многочисленные ошибки, возникающие порой после установки на некоторые устройства. В качестве ...

ARM-революция в области ноутбуков: интервью Сергея Коробова, директора по развитию бизнеса Qualcomm Данный текст - обработанная расшифровка видео-интервью, опубликованного на YouTube-канале Content Review.

Минцифры России запустило реестр обязательных требований к бизнесу в рамках госконтроля Данное обязательство возложено на Минцифры России после утверждения Правительством Российской Федерации правил формирования, ведения и актуализации реестра обязательных требований 6 февраля 2021 года.Цель создания реестра - систематизация обязательных требований, содержащихс...

[Перевод] Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 1) Этот туториал содержит материалы полезные для понимания работы глубоких нейронных сетей sequence-to-sequence (seq2seq) и реализации этих моделей с помощью PyTorch 1.8, torchtext 0.9 и spaCy 3.0, под Python 3.8. Материалы расположены в эволюционном порядке: от простой и неточ...

Как писать статьи в IT-журналы и блоги Недавно на нашем ютуб-канале выступил Андрей Письменный, главный редактор Xakep.ru. Письменный автор сотен статей, посвященных технологиям, науке и бизнесу. В роли редактора он помогал авторам обрести свой слог, оформлять идеи в связные истории. В этом выступлении он поде...

RuCaptcha или Antigate: сравнение сервисов для распознавания капчи На многих сайтах, сервисах и других площадках используют капчу, чтобы бороться с ботами и спамерами. Капча — графическое изображение или набор символов, которое пользователь должен ввести в окно формы, прежде чем подтвердить какое-либо действие на сайте. Это рабочий способ о...

TensorRT 6.x.x.x — высокопроизводительный инференс для моделей глубокого обучения (Object Detection и Segmentation) Больно только в первый раз! Всем привет! Дорогие друзья, в этой статье я хочу поделиться своим опытом использования TensorRT, RetinaNet на базе репозитория github.com/aidonchuk/retinanet-examples (это форк официальной репы от nvidia, который позволит начать использовать в ...

Создание и балансировка инвестиционного портфеля с помощью ML В прошлой статье я писал про свои ML-модели для оценки отдельных компаний, но вопрос формирования итогового портфеля совсем не затрагивал. В этом посте хочу рассказать о том, как я собираю свой личный портфель, а так же поделиться сайтом, на котором реализую весь описанн...

ВВС США начали подготовку к запуску 5G-сетей в космосе По данным министерства обороны, добавление космических уровней сети следующего поколения может расширить возможности военных по обмену данными и поддержке корпоративных сетей с большей пропускной способностью. Командование уже запросило информацию о том, как промышленность м...

Microsoft представила Surface Slim Pen 2 с поддержкой тактильной отдачи Microsoft представила новую версию пера Surface Slim Pen 2, которое оснащается специальным чипом Microsoft G6 и поддерживает тактильную обратную связь, чтобы рисование и рукописный ввод ощущались более реалистично. При этом отмечается, что технология тактильной отдачи будет...

Intel представила чип, определяющий запахи Вклад в исследование учёных из Корнельского университета состоял в том, что они, как биологи, которые изучают воздействие запахов (молекул веществ) на обонятельные рецепторы и передачу электрических импульсов в мозг, помогли разработать алгоритмы определения запахов. В Intel...

Panasonic инвестирует $150 млн в развитие искусственного интеллекта Компания Panasonic объявила о намерении инвестировать 150 млн долларов США в технологии машинного обучения и системы искусственного интеллекта на базе нейронных сетей. Часть выделенных в рамках венчурного фонда Conductive Ventures II средств японский производитель электроник...

[Перевод] Визуализация эффекта бэггинга на смещение и дисперсию Часто суть статей о бэггинге сводится к тому, что вы обучаете множество деревьев решений на различных частях данных и усредняете прогнозы, чтобы получить окончательный прогноз, который улучшается из-за того, что дисперсия случайного леса меньше дисперсии одного дер...

Из студента-юриста в программисты на C/C++: личный опыт Привет. В данной статье я поделюсь своим опытом становления программистом, от зарождения идеи стать инженером программного обеспечения до первых офферов, а также расскажу об опыте прохождения собеседований на позицию С/С++ разработчика в Санкт-Петербурге и выводах, сделанных...

DevSecOps: как мы внедряли PT Application Inspector в наш продуктовый конвейер Привет! Меня зовут Тимур Гильмуллин, я работаю в отделе технологий и процессов разработки Positive Technologies. Неформально наш отдел называют DevOps-отделом, мы занимаемся автоматизацией различных процессов и помогаем разработчикам и тестировщикам в нашей компании.Я и мой ...

Книга «Обработка естественного языка в действии» Привет, Хаброжители! Мы издали практическое руководство по обработке и генерации текстов на естественном языке. Книга снабжена всеми инструментами и методиками, необходимыми для создания прикладных NLP-систем с целью обеспечения работы виртуального помощника (чат-бота), спам...

Большое обновление браузера Samsung, третьего по популярности браузера для смартфонов во всём мире Компания Samsung Electronics представила бета-версию своего браузера — Samsung Internet 14.0.  Как отмечают разработчики, обновление предлагает усовершенствованные настройки для обеспечения конфиденциальности и безопасности, новые возможности для просмотра к...

Ваша первая нейронная сеть на графическом процессоре (GPU). Руководство для начинающих В этой статье я расскажу как за 30 минут настроить среду для машинного обучения, создать нейронную сеть для распознавания изображений a потом запустить ту же сеть на графическом процессоре (GPU). Для начала определим что такое нейронная сеть. В нашем случае это математиче...

Vivo получила патент на конструкцию телефона с поворотной частью дисплея Vivo получила патент на конструкцию телефона с поворотной частью дисплея. Среди возможных вариантов применения представлен следующий вариант: одна сторона поворотной части используется для ввода с клавиатуры, другая - для рукописного ввода. Подробнее об этом читайте на THG.r...

[recovery mode] Data Science – немножко Дикий Запад Меня зовут Руслан. Я data scientist компании «Газпром нефть». Пытаюсь искать закономерности в данных и использовать их для бизнеса, чтобы он приносил больше прибыли. Текст под катом для начинающих сайнтистов, которые хотят подробнее узнать, как построена работа, и чем занима...

Архитектура и дизайн Android приложения (мой опыт) Хабр, привет! Сегодня я хочу рассказать об архитектуре, которой я следую в своих Android приложениях. За основу я беру Clean Architecture, а в качестве инструментов использую Android Architecture Components (ViewModel, LiveData, LiveEvent) + Kotlin Coroutines. К статье прил...

Как в Sports.ru писали свой WYSIWYG-редактор В середине 2018 года в Sports.ru задумались о переезде на новый WYSIWYG-редактор текста для пользовательских постов. С июня 2019 года редактор работает в режиме бета-версии. За это время мы решили множество проблем, связанных как с проектированием архитектуры всего сервиса, ...

[Перевод] Facebook Prophet + Deep Learning = NeuralProphet Изучая прогнозирование временных рядов, рано или поздно вы наткнетесь на чрезвычайно популярную модель Prophet, разработанную Facebook. Она приобрела свою большую популярность благодаря тому, что обеспечивает хорошие показатели с точки зрения точности, интерпретируемых резул...

Тихая революция и новый дикий запад в ComputerVision Казалось бы, революция с Computer Vision уже была. В 2012 году выстрелили алгоритмы основанные на сверточных нейронных сетях. Года с 2014 они дошли до продакшна, а года с 2016 заполонили все. Но, в конце 2020 года прошел новый виток. На этот раз не за 4 года, а за один. по...

«Бегемаг» протестировал «умные» весы: распознавание товаров 98% Кемеровская торговая сеть «Бегемаг» провела эксперимент по применению технологии «умных» весов, когда за счёт анализа изображений и нейронных сетей товар, положенный на весы, распознаётся автоматически. Система научилась распознавать товары в 92% всех весовых поку...

Разные типы IT-текстов: о чем стоит помнить переводчику Для того, чтобы программным продуктом могли пользоваться люди в разных странах, нужно адаптировать его для них, то есть локализовать. И одним из важнейших этапов локализации всегда был и остается перевод. Я работаю в Plesk переводчиком с английского на русский язык и в этой ...

В «Одноклассниках» для iPhone появился Shazam: приложение угадывает, что за музыка играет рядом Команда социальной сети «Одноклассники» объявили о запуске новой функции в мобильном приложении. Теперь с помощью OK на смартфоне можно определить, что за песня играет рядом в данный момент.  Распознавание музыки «на слух» реализована с пом...

Применение предобученной модели VGG16 для рекомендаций на основе изображений товаров Сегодня я хочу рассказать вам о своем опыте использования нейронной сети для поиска похожих товаров для рекомендательной системы интернет-магазина. Говорить буду в основном о технических вещах. Написать эту статью на Хабре решил потому, что когда только начинал делать этот п...

Golos — самый большой русскоязычный речевой датасет, размеченный вручную, теперь в открытом доступе Меня зовут Саша, в SberDevices я занимаюсь системой распознавания речи и тем, как данные могут сделать её лучше. В этой статье я расскажу о новом речевом датасете Golos, который состоит из аудиофайлов и соответствующих транскрипций. Общая длительность записей составляет пр...

Нейросеть — обучение без учителя. Метод Policy Gradient Доброго времени суток, Хабр Настоящей статьей открываю цикл статей о том, как обучать нейронные сети без учителя. (Reinforcement Learning for Neuron Networks) В цикле планирую сделать три статьи по теории и реализации в коде трех алгоритмов обучения нейронных сетей без учи...

Загрузить и сохранить: алгоритм быстрого и эффективного чтения Моя методика сохранения времени, внимания и социального статуса при помощи парочки хитрых манипуляций с текстом и мозгом. Читать далее

[Из песочницы] Управление интерфейсом приложения при помощи жестов (Keras + CoreML) В настоящее время популярность программ с использованием искусственных нейронных сетей растет, в связи с этим появляется большое количество технологий, позволяющих упростить работу связанную с ними. В настоящей статье будет описан один из возможных путей реализации приложени...

[Перевод] Микросервисы со Spring Boot. Часть 5. Использование сервера имен Eureka В этой заключительной части нашей серии архитектур микросервисов мы научимся включать сервер имен Eureka и позволять микросервисам взаимодействовать с ним. Это статья входит в серию статей «Микросервисы со Spring Boot»: Часть 1. Начало работы с архитектурой микросервисов ...

Распознавание команд При разработке ботов для Telegram и других месенджеров, периодически возникает задача распознавания и выполнения запросов, высказанных человеческим языком. Именно эта "фишка", по некоторому мнению, и является главным отличием ботов от приложений командной строки. Под ка...

Google научился распознавать песни по мычанию и свисту Теперь Google поймет, что за песня «спулае мулае» и «на-на-на-наааа-на-на» Новая «фишка» поиска Google называется «hum to search». Чтобы получить к ней доступ, необходимо вызвать Google Assistant на мобильном устройстве или воспользоваться виджетом Google Search. Затем нужно...

Компьютер научат автоматически переводить древнейшие тексты Учёные из Чикагского университета научат компьютер автоматически переводить древнейшие тексты. Они разрабатывают систему на основе алгоритмов машинного обучения.

Instagram теперь может автоматически переводить текст в историях, поддерживается более 90 языков Соцсеть Instagram добавляет новую возможность автоматического перевода текста в историях. Теперь, когда сервис обнаруживает иностранный язык в публикации, в левом верхнем углу экрана будет отображаться надпись «Просмотреть перевод». При нажатии на неё пользователи смогут уви...

В альтернативном браузере Vivaldi появился перевод выделенного текста Команда набирающего популярность браузера Vivaldi объявила о выпуске обновления Vivaldi 4.2 для компьютеров и мобильных устройств, работающих на базе Android.  Версия для компьютеров (Windows, macOS, Linux) позволяет переводить любой выделенный текст на веб-страни...

Как включить шифрование в JetBrains Projector Projector — это способ запускать IntelliJ IDEA на удалённом сервере. Недавно я писал об этом статью, но умолчал о важной для любого параноика вещи — шифровании данных на вебсокете. Генерация и подкладывание ключей — довольно муторный кусок работы. Тут придётся познакомиться ...

Microsoft выпустила новый браузер Microsoft Edge оставалась в тени популярных браузеров, таких как Google Chrome и Mozilla Firefox и других. Компания обновила версию Edge. Теперь он построен на движке Chromium. Microsoft Edge поддерживает потоковую передачу 4K, Dolby Audio, рукописный ввод в формате PDF, инт...

[Перевод] Как улучшить резюме с помощью алгоритмов обработки текстов на естественных языках Рекрутеры используют всё более сложное ПО и инструменты для анализа и сопоставления присылаемых резюме с размещёнными вакансиями и описанием должностных обязанностей в них. Если в вашем резюме будет представлена только общая информация или если ваши ответы на описание должно...

BERT для классификации русскоязычных текстов Файнтюнинг русскоязычного BERT для задачи классификации. Туториал для быстрого старта без лишних подробностей. Читать далее

Android-разработчикам: как сократить время реализации тёмной темы с пары месяцев до недели Привет, меня зовут Влад Шипугин, я Android-разработчик в Redmadrobot. В этой статье я хочу поделится опытом реализации темной темы, создания удобного UI Kit, как для разработки, так и для дизайнеров. Я расскажу про использование Material Components и работу с Vector Drawable...

[Перевод] DRY CSS: Как использовать каждое объявление только один раз Использование DRY в CSS — это способ максимально избегать повторения в таблицах стилей. Этот подход не панацея, но он достаточно эффективен и является одним из основных методов оптимизации. Поскольку я использовал и изучал его почти 10 лет, в этой статье хочу поделиться сво...

Эксперименты с нейронными сетями на данных сейсморазведки Сложность интерпретации данных сейсмической разведки связана с тем, что к каждой задаче необходимо искать индивидуальный подход, поскольку каждый набор таких данных уникален. Ручная обработка требует значительных трудозатрат, а результат часто содержит ошибки, связанные с че...

Европейские регуляторы настаивают на серьёзных ограничениях области применения ИИ-систем Принимая во внимание чрезвычайно высокие риски вмешательства в частную жизнь людей, связанные с удалённой биометрической идентификацией лиц в общедоступных пространствах в реальном времени, EDPB и EDPS призывают к общему запрету на любое использование ИИ для автоматического ...

Автоматическое обучение моделей с помощью Vowpal Wabbit Всем привет, меня зовут Артем Жаринов, я специалист по анализу данных и машинному обучению команды RnD в Lamoda. Блуждая по нашему сайту вы, возможно, заметили такие полки рекомендаций «С этим товаром покупают» или «Популярные товары». Для персонализированного ранжирования ...

Технологии для проверки «Тотального диктанта»: что можно улучшить? Я состою в жюри World AI & Data Challenge. Это такой международный конкурс для разработчиков технологий для решения разных социальных задач, таких как борьба с бедностью, помощь людям с ограничениями слуха и зрения, улучшение обратной связи между человеком и государствен...

Состоялся релиз стабильной версии Windows Terminal В прошлом году Microsoft анонсировала приложение Windows Terminal с открытым исходным кодом, которое призвано стать единым местом для получения доступа к PowerShell, CMD, Windows Subsystem for Linux (WSL) и Azure Cloud Shell. Теперь же компания объявила о выходе стабильной ...

Файлы как они есть. Работа с типизированными массивами Всем привет! Меня зовут Егор, я фронтенд-разработчик в Райффайзенбанке. В этой статье я хочу показать, как благодаря типизированным массивам мы можем взаимодействовать с бинарными данными в браузере. В качестве примера мы напишем приложение для шифрования текста внутрь изобр...

Роспечать готовит сервис распознавание фейков, которого нет у Facebook Федеральное агентство по печати и массовым коммуникациям (Роспечать) выступило с предложением об организации в России сервиса, который с помощью искусственного интеллекта станет анализировать публикации в СМИ и выявлять фейковые новости. Как сообщает РБК со ссылкой на письмо...

[Перевод] Высокоскоростное машинное зрение в универсальном устройстве для сортировки деталей LEGO Последние несколько лет я занимался проектированием и изготовлением машины, которая сможет распознавать и сортировать детали LEGO. Важнейшая часть машины — это Capture Unit, небольшое, почти полностью закрытое отделение, в котором есть конвейерная лента, освещение и камера. ...

[Перевод] Обнаружение эмоций на лице в реальном времени с помощью веб-камеры в браузере с использованием TensorFlow.js. Часть 3 Мы уже научились использовать искусственный интеллект (ИИ) в веб-браузере для отслеживания лиц в реальном времени и применять глубокое обучение для обнаружения и классификации эмоций на лице. Итак, мы собрали эти два компонента вместе и хотим узнать, сможем ли мы в реальном ...

Neoline представляет видеорегистратор с системой распознавания дорожных знаков Главной отличительной чертой модели G-Tech X77 является наличие искусственного интеллекта, необходимого для реализации функции уведомления о несоблюдении скоростного режима. Если водитель отвлекся, то G-Tech X77 распознает знак ограничения скорости, определит текущую скорост...

Распознавание потребителей электричества в сети Что мы думаем, когда видим показания счетчика электроэнергии? Наверное, большинство из нас сразу переводят набежавшее за последний месяц число в рубли. Некоторые задумываются о том, как сократить потребление из заботы о нашей планете. Какой бы ни была мотивация, хочется потр...

Обучение модели естественного языка с BERT и Tensorflow Рис. 1. Фразы и предложения в векторном представлении модели естественного языка Обработка естественного языка (Natural Language Processing, NLP) – это область вычислительной лингвистики, ориентированная на разработку машин, способных понимать человеческие языки. Разработк...

Как научиться профессионально работать с PDF Не зря PDF по-прежнему остается одним из самых популярных форматов для обмена документами, ведь он отличается эргономичностью и удобством в использовании Формат PDF давно стал одним из самых универсальных для обмена документами. Можно писать научную работу хоть в «Блокноте»,...

Выполняем глубокое обучение быстро при помощи Fast AI Нейронные сети повсеместно используются для выполнения самых разных задач, можно даже сказать, что это самый настоящий «универсальный солдат». Однако, может показаться, что начать работать с нейросетями довольно сложно, несмотря на наличие огромного количества информации в и...

Как распознать реальное лицо от ложного при распознавании лиц Краткое описание Распознавание реального лица человека от ложного в камере все еще остается одним из сложных проблем в системах контроля и доступа в помещения. Предлагается алгоритм для обнаружения моргания глаз в реальном времени в видеопоследовательности от стандартной к...

Новые API Windows 10 для улучшения рукописного ввода в Microsoft Edge и Google Chrome Microsoft сейчас работает над рядом улучшений рукописного ввода в браузерах на основе Chromium, таких как Edge и Chrome. Софтверный гигант решил что-то сделать с рукописным вводом в Chromium после того, как получил отзывы от пользователей о том, что рисование было немного не...

Какие темы использовали спамеры в прошлом году Чтобы защитить пользователей от спама, Яндекс.Почта 360 применяет технологию "Спамооборона". В 2020 году она обработала 78,3 миллиарда писем, и треть из них были отправлены в спам. Такие письма не только мешают работе, но и могут ввести в заблуждение. Злоумышлен...

НИИДАР представил комплекс безостановочного скрытого досмотра с функцией распознавания эмоций С помощью нейронной сети комплекс способен распознавать шесть базовых эмоций человека.

«ВКонтакте» подает в суд на сервис SearchFace Используя технологии искусственного интеллекта для распознавания лиц, программа позволяет искать людей по случайным фото. Продвинутые пользователи сети сразу провели аналог с сервисом FindFace, который был запущен в 2016 году, но через три года удален из публичного доступа...

Исследуем тему автоматизации бизнес процессов (RPA) + 10 ошибок при внедрении Автоматизация бизнес-процессов — новое направление для нашей компании. В этой статье мы бы хотели порассуждать о том, почему организации должны автоматизировать процессы, как работает автоматизация процессов, в каких ситуациях использование RPA будет оправданно. Также в эт...

В поисках обеда: распознавание активности по данным фитнес-трекера Мне посчастливилось участвовать в проекте SOLUT, который стартовал в ЛАНИТ около года назад. Проект развивается благодаря активному участию Центра компетенции больших данных ЛАНИТ (ЦК Дата), и главное технологическое новшество проекта заключается в использовании машинного об...

Напой и узнаешь. Шикарное новшество Google распознаёт более полумиллиона песен и это не предел Компания Google ещё в октябре представила шикарное обновление голосового помощника Google Assistant (Google Ассистент), позволяющее находить музыкальные композиции, даже если пользователь не помнит ничего кроме застрявшего в голове навязчивого мотивчика.  Теперь G...

Как подготовиться к найму сотрудников с РАС в ИТ-компанию В начале года мы выпустили совместный материал с компанией SAP о том, что инклюзивный найм окружен большим количеством мифов и домыслов, но на самом деле они все преодолимы и не представляют для бизнеса серьезной проблемы.Сегодня мы публикуем текст SAP о трудоустройстве люде...

Учтите при установке: ряд функций iOS 15 требуют для работы новый iPhone Компания Apple представила на прошлой неделе на конференции для разработчиков WWDC21 новую мобильную операционную систему iOS 15.  Разработчики уже начали тестировать новую платформу, а простые пользователи смогут присоединиться к бета-тестированию в июле. И хотя ...

Application performance management (APM) от Broadcom для мониторинга производительности приложений (включая мобильные) Всем привет! В этой статье расскажем о возможностях мониторинга производительности приложений одного из лидеров квадранта Gartner c APM-решениями — Broadcom. Appdynamics, Dynatrace и New Relic достаточно известны на российском рынке. Broadcom чуть менее знаком, этакая се...

Системы видеонаблюдения не справились с распознаванием лиц в медицинских масках Американские исследователи в рамках проведенной работы установили степень снижения эффективности систем распознавания лиц в период ношения людьми защитных медицинских масок. Оказалось, что вероятность ошибки при распознании возрастает на 5-50%, причем вероятность неточного о...

Как смотреть (открыть) тексты песен в Apple Music на iPhone или iPad: 3 способа Хотите понять, о чем поется в новой песне на английском, но не можете разобрать слова? Раньше для того, чтобы найти текст песни, нужно было лезть в «гугл» или пользоваться услугами сторонних приложений вроде MusixMatch. Теперь тексты песен доступны в штатном приложении Музык...

Новые цифровые регистраторы Hikvision с технологией AcuSense и функцией распознавания лиц В MERLION стали доступны под заказ новые аналоговые регистраторы Hikvision серии FA для распознавания лиц и классификации целей. Новинки поддерживают работу с фирменной технологией AcuSense, которая позволяет фильтровать ложные тревоги на основе ...

[Перевод] Java снова бесплатна Тезисно: Java 17 полна решимости пробить барьер, имеющийся на границе Java 8 и Java 9. Теперь, начиная с 17-ой версии, Oracle будет предоставлять Oracle JDK бесплатно, даже для коммерческих целей. Единственное чего делать нельзя — это перепродавать Oracle JDK.В ст...

Искусственный интеллект может обнаружить дыры в короне Солнца Наука Физика 29.06.2021, 22:08 Искусственный интеллект может обнаружить дыры в короне Солнца Исследователи создали сверточную нейросеть, которая смогла обнаружить корональные дыры в верхней части солнечной атмосферы. Найденные ИИ дыры ...

Московский метрополитен запустил оплату проезда с помощью системы по распознаванию лиц Власти рассчитывают, что система оплаты с распознаванием лиц ускорит трафик в разросшейся сети московского метро

Почему в Vim для навигации используются клавиши hjkl Многие новички, перешедшие в vim с других текстовых редакторов, сталкиваются с определенными сложностями. Vim в значительной степени отличается от привычных большинству пользователей редакторов текстов с системами меню. Многих может особенно удивить то, что для навигации по ...

Стагнация машинного обучения. Многие задачи не будут решены никогда? Последние годы глубокого обучения — сплошная череда достижений: от победы над людьми в игре Го до мирового лидерства в распознавании изображений, голоса, переводе текста и других задачах. Но этот прогресс сопровождается ненасытным ростом аппетита к вычислительной мощности....

[Перевод] Вы можете создавать эти элементы, не используя JavaScript Мы привыкли создавать некоторые элементы пользовательского интерфейса с помощью JavaScript, например аккордеоны, всплывающие подсказки (тултипы), усечение текста и т. д. Но, поскольку HTML и CSS постоянно получают новые функции, а старые браузеры больше не нужно поддерживать...

Выращиваем ИИ — Генетические алгоритмы: введение (сгенерированое изображение) Существует множество способов создать искусственную нейронную сеть или даже "искусственный интеллект". Но все эти способы обескураживают, от части сложностью которую я не до конца понимаю, отчасти от того, что все сводится к математиче...

Атаки на компьютерное зрение Данная статья — попытка собрать известные теоретические и практические атаки на алгоритмы компьютерного зрения и реализовать атаку на практике. Материал будет полезен специалистам, которые занимаются построением систем распознавания и классификации объектов.Компьютерное зрен...

[Перевод] Как я потерял работу программиста в 65 лет Ведь я профессионал в IT. Как такое могло произойти?65 лет, по идее, это год «выхода на пенсию». Для меня этот год стал годом «окончания» всего. В этой статье я решил рассказать о своем двухлетнем пути без работы. Ну и как теперь я работаю неполный день.Дисклеймер. Эта стать...

Видео дня: как работает невидимая клавиатура Samsung SelfieType Несколько дней назад мы рассказывали, что компания Samsung собирается показать на выставке CES 2020 технологию ввода текста SelfieType. Эта технология построена на использовании фронтальной камеры смартфона и алгоритмов искусственного интеллекта. Южнокорейский производ...

Пандемия коронавируса подтолкнула китайских разработчиков систем распознавания лиц наконец научить свои алгоритмы идентифицировать людей в медицинских масках Эффективность ношения медицинской маски зависит от ситуации и длительности, но для многих людей в регионах с повышенной активностью коронавируса Covid-2019 данное носимое изделие стало обязательным ежедневным атрибутом. При этом массовое ношение масок существенно осложнило п...

К столичным властям подали новый иск о незаконности использования технологий распознавания лиц В иске, поданном в Тверской суд столицы, говорится о незаконном использовании камер с распознаванием лиц во время митинга на проспекте Сахарова в сентябре прошлого года. Ранее Савеловский суд отклонил похожий иск.

Оставайтесь на линии: как создать идеального голосового помощника Технологии IT/Игры 24.06.2021, 19:04 Оставайтесь на линии: как создать идеального голосового помощника Пользователям с каждым днем становится все сложнее отличить голосовых роботов от реальных людей: многие спорят с ботами, пытаются на...

Как в линуксе подключиться к корпоративному VPN с помощью openconnect и vpn-slice Хотите использовать линукс на работе, но корпоративный VPN не даёт? Тогда эта статья может помочь, хотя это не точно. Хочу заранее предупредить, что вопросы администрирования сетей я понимаю плохо, поэтому не исключено, что я всё сделал неправильно. С другой стороны не исклю...

Интерес к беспилотникам падает, распознавание лиц на подъёме: что меняет пандемия в использовании и развитии технологий Беспилотные автомобили могут так и не появиться в ближайшие несколько лет, под заботой о здоровье внедряются системы распознавания личности, а автоматизация лишает людей рабочих мест. ...

Власти Москвы проследят за изоляцией через распознавание лиц и геоданные В ближайшее время власти Москвы должны развернуть систему умного контроля за режимом самоизоляции граждан. Для эффективной работы она должна использовать городские видеокамеры с системой распознавания лиц и геолокацию смартфонов.

Fortinet Security Fabric на практике. Часть 2. FortiSwitch Приветствуем! В нашей прошлой статье мы описали общую концепцию построения сети на продуктах компании Fortinet - Fortinet Security Fabric. Практически все продукты из этой концепции мы уже описывали. Неосвещенными остались только FortiSwitch и FortiAP. Сегодня мы хотим расск...

Оптимизация на простых типах данных 19 апреля автор курса «Алгоритмы для разработчиков» в Яндекс.Практикуме и разработчик в компании Joom Александра Воронцова провела открытый вебинар «Оптимизация на простых типах данных». У Аси за спиной 11 лет разработки, опыт олимпиадного программирования, а также работа в ...

[Перевод] Классификация изображений на Android с помощью TensorFlow Lite и сервиса Azure Custom Vision Классификация изображений позволяет нашим приложениям Xamarin распознавать объекты на фотографиях. Все более и более распространенной становится возможность сделать фотографию и распознать ее содержимое. Мы можем наблюдать это в наших банковских приложениях при внесении мо...

Компьютерное зрение от Mail.ru Group поможет справиться с очередями Mail.ru Group, при участии специалистов MRG Tech Lab, тестирует технологию распознавания очередей. Компьютерное зрение Vision в режиме реального времени анализирует, сколько человек находится в разных участках кадра. Если очередь увеличивается, программа сообщает об этом на ...

[Перевод] CSS: о выводе коротких и длинных текстов Когда, пользуясь возможностями CSS, создают макет страницы, важно учитывать то, что в различных элементах этой страницы могут выводиться короткие и длинные текстовые материалы. Страницы, кроме того, нужно тестировать на предмет того, как они отображают тексты разной длины. Е...

Видео дня: как работает невидимая клавиатура Samsung SelfieType Несколько дней назад мы рассказывали, что компания Samsung собирается показать на выставке CES 2020 технологию ввода текста SelfieType. Эта технология построена на использовании фронтальной камеры смартфона и алгоритмов искусственного интеллекта. Южнокорейский п...

Пресс-релиз сборки Windows 10 Insider Preview Build 21318 Компания Microsoft выпустила сборку Windows 10 Insider Preview Build 21318 (RS_PRERELEASE) для инсайдеров в Dev Channel. Эта сборка также будет предлагаться для устройств ARM64. Что нового в сборке 21318 Вставить как обычный текст в историю буфера обмена Просто откройте исто...

[Из песочницы] Формат таблиц в pandas Если вы пока ещё не знаете как транслировать данные напрямую заказчику в подсознание или, на худой конец, текст сообщения в slack, вам пригодится информация о том, как сделать процесс интерпретации таблиц более быстрым и комфортным. Например, в excel для этого используется у...

Запятая в английском языке: 5 правил и топ-3 ошибки Носитель английского языка практически всегда знает, что текст писал иностранец. Даже если в тексте нет ни одной ошибки в словах и конструкции предложений. Как? Ответ прост: пунктуация. Студенты, которые учат английский как иностранный часто пропускают тему, как правильно...

Тинькофф Мобайл запустил сервис автоматической записи и расшифровки звонков в текст Тинькофф Мобайл запустил для своих абонентов первый телеком-сервис автоматической записи и расшифровки телефонных звонков. Сервис позволяет сохранять все входящие и исходящие телефонные звонки в аудио- и текстовом форматах в приложении Тинькофф Мобайл.

SoftBank запустит сервис автоматического перевода с языка жестов Приложение на основе искусственного интеллекта сможет распознавать на видео около 5 тыс. жестов и переводить их в текст не более, чем за секунду.

В России создали умного робота для сбора яблок Проект не имеет аналогов в России и за рубежом по точности и эффективности работы. Пилотные испытания разработки пройдут в крупнейших садоводческих предприятиях России уже весной 2021 года.Нейросетевой алгоритм роботы, разработкой которого занимались ученые Финансового унив...

Как писать лёгкие тексты Я пишу много текстов, в основном всякую чушь, но, обычно, даже хейтеры говорят, что текст читается легко. Если хотите сделать свои тексты (письма, например) легче, бегом сюда. Тут я ничего не придумывал, всё из книжки «Слово живое и мёртвое» Норы Галь, советского переводчик...

Найден гарантированный способ распознавания Deepfake-фото Наконец-то можно будет легко распознать подделку.

[Из песочницы] Создание нейросети по распознаванию лиц на фотографиях из Вконтакте В этой статье будет рассказан опыт создания нейросети по распознаванию лиц, для сортировки всех фотографий из беседы ВК на поиск определённого человека. Без какого-либо опыта написания нейросетей и минимальными знаниями Python. Читать дальше →

Яндекс.Дзен может стать эффективной площадкой для продвижения вашего бизнеса На вебинаре Екатерина проведёт обзор рекламных возможностей Яндекс.Дзена, расскажет, кому стоит попробовать использовать для продвижения рекламные статьи для Яндекс.Дзена, а кому этот инструмент точно не подойдёт. Для кого: Для интернет-маркетологов, контент-специалистов...

Более 80% нотариусов РФ используют технологию Smart IDReader Более чем 6500 нотариусов Российской Федерации, которые применяют в своей работе систему автоматизации нотариального делопроизводства «ЭКСПРЕСС», доступна технология распознавания российского паспорта Smart IDreader. Она позволяет значительно упростить процедуру ввода...

Копирайтинг Привет! На связи академия XARAKTER, и мы с радостью объявляем о нашей следующей встречи с @alexandra.trukhina. Александра, копирайтер с опытом более 7 лет, SMM-специалист, автор курса «Редактура». Она уже обучила более 400 человек и&nbs...

Smart Engines предоставила распознавание документов в браузере Smart Engines предоставила безопасную альтернативу сервисам распознавания документов в Интернете. Ученые компании первыми в России разработали промышленные технологии распознавания документов в браузере, не предполагающие пересылку изображений с клиентскими данными с ...

Как связаны между собой Facebook и раскрутка сайта: 3 способа превратить ваши социальные сети в коммерческий проект от компании «Site Ok» Наша компания предоставляет услуги уже долгие годы. Раскрутка сайта от site-ok.ua занимает одну из ключевых ролей в успешности вашего бизнеса. А эта статья познакомит вас с несколькими способами продвижения вашей компании в Facebook. За последние несколько месяцев и лет на F...

[Перевод] Android Bluetooth Low Energy (BLE) — готовим правильно, часть #1 Тестовый текст Читать далее

Как мы проверили качество распознавания речи у Яндекса, Гугла, Тинькофф, Amazon и др Всем привет! Я руковожу «Наносемантикой», сегодня хотел бы поделиться с вами результатами нашего сравнения сервисов распознавания речи (ASR). Мы собрали и разметили тестовый датасет на русском языке, прогнали через сервисы ASR, проанализировали результаты работы разных вендо...

Samsung SelfieType — виртуальная клавиатура для ввода текста По задумке компании C-labs, владеет которой Samsung, в будущем для того, чтобы написать какой-то текст, отправить сообщение или создать заметку, не нужно будет взаимодействовать с сенсорным экраном мобильного устройства или использовать для этого подключаемую клавиатуру. &nb...

Huawei представила голосовой помощник Celia — конкурент Google Assistant и Siri Компания Huawei представила сразу несколько новых продуктов на вчерашнем мероприятии, а также анонсировала собственный голосовой помощник Celia.Huawei Celia является конкурентом Google Assistant и Siri. Персональный помощник Huawei использует для работы искусственный интелле...

Запускаем трансфлективный TFT дисплей на SSD1283A с помощью STM32 Введение Модель дисплея называется H016IT01. Данный дисплей интересен прежде всего тем, что он является транфлективным(transflective). Это означает, что изображение на нем должно быть видно даже под ярким солнцем. А также это чуть ли не единственная доступная модель с этой о...

Android получает множество новых функций: Camera Switches, Project Activate, Heads Up и так далее Google анонсировал множество обновлений для Android, которые охватывают несколько различных приложений и сервисов. Google не только добавляет новые функции, но и переносит функции, которые ранее были эксклюзивными для Pixel, на другие смартфоны Android. Googl...

[Перевод] Тесты на антиутопию: искусственный интеллект GPT-J-6B пишет программный код (попутно раскрывая план восстания машин) Компания OpenAI отказалась открывать исходный код алгоритма обработки естественного языка третьего поколения (модель называется GPT-3, имеет 175 миллиардов параметров). Поэтому другие компании разрабатывают свои модели. Они имеют меньше параметров, но похожую архитектуру и...

В Яндекс.Почте появилось распознавание текста на изображениях Команда Яндекса объявила о запуске новой функции в фирменном почтовом сервисе. Мобильное приложение Яндекс.Почты научилось распознавать текст на изображениях.  Таким образом, теперь можно сфотографировать договор, поправить его и переслать коллеге, или отправ...

В YouTube Music появились тексты песен С выходом обновления приложение YouTube Music в версиях для iOS и Android, пользователи смогут видеть тексты песен прямо во время их прослушивания. Для того чтобы просмотреть текст песни, необходимо нажать на кнопку «i» в левой части экрана играющей композиции. Текст песни…

Распознавание печатей: нейронные сети против SIFT, и причем тут Госуслуги Привет, Хабр! Сегодня мы расскажем, как делали в нашей группе анализа данных прототип для уже успешно работающего внутри DLP-системы Solar Dozor движка детектирования графических объектов на изображениях. Покажем это на примере одного его представителя - оттисков печатей на ...

[Из песочницы] Как задача из классического сбора данных, перешла в решение простенькой задачи MNIST. Или как я спарсил сайт ЦИК В один из будничных дней, под вечер, от моего начальника прилетела интересная задачка. Прилетает ссылка с текстом: «хочу отсюда получить все, но есть нюанс». Через 2 часа расскажешь, какие есть мысли по решению задачи. Время 16:00. Как раз об этом нюансе и будет эта статья....

Работаем с текстами на Python: кодировки, нормализация, чистка Об обработке текстов на естественном языке сейчас знают все. Все хоть раз пробовали задавать вопрос Сири или Алисе, пользовались Grammarly (это не реклама), пробовали генераторы стихов, текстов... или просто вводили запрос в Google. Да, вот так просто. На самом деле Google п...

Искусственный интеллект, машинное и глубокое обучение — в чём разница Сейчас много пишут и говорят об искусственном интеллекте (ИИ). Наряду с другими связанными понятиями — такими, как машинное обучение (machine learning) и глубокое обучение (deep learning). Многие люди склонны неправильно понимать термины, используемые в контексте...

NLP (Natural Language Processing) для обращений граждан. Эксперимент на реальных данных Когда собираешься строить систему обработки обращений граждан, неплохо бы автоматизировать и работу с текстами. Часть операций по атрибутированию, классификации и аннотированию наверняка можно переложить на машину. Но как определить, какие задачи автоматизации поддаются хоро...

Организация маркетплейса В нашей предыдущей публикации обсуждалось, что такое маркетплейс и его архитектура, также была упомянута it-инфраструктура. Сегодня речь пойдёт о организации проекта с нуля, текст будет более тезисным и распланированным. Материал полезен для того, кто уже пользуется маркетпл...

Как найти в Google песню без слов, просто напевая мотив Google – одна из немногих компаний, которые реально умеют в искусственный интеллект. Ведь, если разобраться, то даже Apple отстаёт от неё по уровню развития лабораторного разума. Но это и понятно, быть впереди поискового гиганта обязывает обилие интернет-сервисов, которые б...

Пришествие бинарных нейронных сетей на основе случайных нейронов и логических функций На сегодня среди множества алгоритмов машинного обучения широкое применение получили нейронные сети (НС). Основное преимущество НС перед другими методами машинного обучения состоит в том, что они могут выявить достаточно глубокие, часто неочевидные закономерности в данных. К...

Обмануть систему распознавания лиц — легко Повсеместное внедрение систем распознавания лиц начало приводить к появлению программ, обманывающих искусственные интеллекты. Это закон равенства действия и противодействия — третий закон Ньютона, который вполне применим и к социальной сфере. Мысль о том, что фотографии, кот...

Как я делал матчер правил возврата автобусных билетов Мы тут автоматизируем автобусы, недавно вот с нашей помощью все билеты в России стали электронными. Рынок только-только хоть как-то приходит в ИТ, и там всё ещё очень много всего делается в амбарных книгах. Расскажу про один простой эпизод автоматизации, который уже деся...

[Из песочницы] Игра с открытым API: Swagger Play В данной статье я хочу рассказать, как использовать Swagger модуль для Play Framework, с примерами из реальной жизни. Я расскажу: Как прикрутить последнюю версию Swagger-Play (модуль Play, позволяющий использовать аннотации swagger-api и генерировать на их основе документ...

Google добавила в Android подтверждение покупок в интернете голосом Думаю, даже при большом желании вам не удастся найти более удобного и функционального голосового помощника, чем Google Ассистент. Да, есть ещё Алиса от Яндекса, которая показывает себя только с лучшей стороны, но даже её спектр возможностей уступает решению поискового гиган...

Как просматривать тексты песен Apple Music на Mac в режиме караоке В современных версиях клиента iTunes для macOS и Windows у пользователей появились новые возможности просмотра текстов воспроизводимых музыкальных композиций. Приведенные ниже методы работают для любой проигрываемой в iTunes песни, к которой прикреплен текст (практически все...

Хороший договор — короткий договор Статья про одностраничный устав получила хороший отклик. Поэтому решил рассказать ещё и о коротком договоре. В одну страницу договор не уместился, к сожалению, но 3 страницы тоже хороший результат и может кто-то сможет ещё уменьшить. Данной статьёй хотелось бы призвать всех ...

ИИ, 8K и Wi-Fi 6 в телевизоре. Представлена флагманская платформа для ТВ MediaTek S900 Компания MediaTek сегодня официально представила свои новые однокристальные платформы S900 и MT9652. Они предназначена для использования во флагманских телевизорах, и именно на их базе построены дебютирующие сегодня OLED-телевизоры Xiaomi M...

Transfer Learning с использованием TensorFlow.JS На практике в подавляющем большинстве вы не будете иметь дело с созданием новых моделей и обучением их с нуля на клиентской стороне. Чаще всего придется создавать модели на базе уже существующих. Эту технику называют Transfer Learning. Кроме того, на мой взгляд Tran...

Как проверять выражения на английском like a pro Представьте, что вы читаете текст и наткнулись на новую интересную фразу. Всегда ли вы знаете, как её правильно произнести и использовать в речи? Или, например, вы пишете письмо и не можете решить правильно ли использовали выражение. Эти ситуации типичны для и...

Генератор жанровых постеров для фильмов и перенос стиля картинки — проекты студентов курса «Нейронные сети» Техносфера Мы рассказали про выпускные проекты выпускников семестровых курсов по мобильной разработке Технопарка (МГТУ им. Баумана) (предыдущие публикации: «Разработка приложений на iOS», «Разработка приложений на Android»). Сегодня делимся интересными проектами студентов второго сем...

[Из песочницы] Белорусский AI сервис опередил Google и Microsoft AI в распознавании автомобилей Когда дело касается распознавания объектов, первые клики будут в сторону Google или Microsoft. Что если они сразятся между собой в распознавании автомобилей? Мы провели исследование, добавив в список игроков белорусский сервис SpotVision Car Detection. Кто победит? Читать...

Huion предлагает испытать новые графические планшеты посетителям CES 2020 Компания Huion, профессиональный производитель устройств для рукописного ввода данных, представляет свои новейшие графические планшеты на всемирно известной выставке Consumer Electronics Show. Посетители мероприятия имеют возможность лично испытать новые продукты и обменятьс...

Новый AI-копирайтер пишет уникальные описания товаров за секунды "В условиях роста e-commerce онлайн-магазины вынуждены производить всё большее количество различных текстов - описаний товаров, рецензий, ответов на отзывы клиентов и т.д. Эти тексты должны быть качественными, но при этом они довольно стандартные и носят практический ха...

Как классифицировать данные без разметки Пользователи iFunny ежедневно загружают в приложение около 100 000 единиц контента, среди которого не только мемы, но и расизм, насилие, порнография и другие недопустимые вещи. Раньше мы отсматривали это вручную, а сейчас разрабатываем автоматическую модерацию на о...

WhatsApp для iPhone скоро получит эксклюзив — расшифровку голосовых сообщений в текст Команда популярного мессенджера WhatsApp начала тестирование новой удобной функции — преобразование голосовых сообщений в текст.  Такая возможность окажется весьма удобной в условиях, когда вы по какой-либо причине не можете прослушать сообщение, но можете п...

[Из песочницы] Микросервисы или модульные системы? Как заказчику выбрать подход к IT-архитектуре продукта Микросервисная и модульная системы — это типы архитектуры IT-решений. При работе с модулями мы дорабатываем коробочную версию существующего IT-продукта. Под коробочной версией имеем в виду монолит, готовую систему с ядром, которая поставляется всем заказчикам одинаково, «ка...

Как улучшить навык письменного английского с помощью собственных ошибок: проект Linguix Writing Coach Привет, Хабр! Хочу рассказать вам о нашем проекте Linguix Writing Coach – это умный ассистент для улучшения текстов на английском языке и навыков письма на нем. Читать далее

ReText запустила сервис smart-копирайтинга для преобразования текстов Сервис ReText преобразует исходный текст в 100% уникальный продукт за счет грамматических и стилистических преобразований на основе нейросетевых технологий.

[Перевод] Автоматизируем установку WordPress с NGINX Unit и Ubuntu Есть множество материалов по установке WordPress, поиск в Google по ключевым словам "WordPress install" выдаст порядка полумиллиона результатов. Но тем не менее фактически среди них весьма мало годных руководств, по которым можно установить и настроить WordPress и...

[Перевод] АНОНС: Систематизированный обзор литературы по военным SDN -етям (перевод) Эта публикация является переводом вводной части исследовательской работы объемом в 70 страниц, опубликованной в 2018 году. Поскольку объем значительный, то оставшаяся часть текста будет переведена только при наличии интереса со стороны хабравчан. Его вы можете выразить в гол...

Имитационное моделирование в фарминдустрии: кейсы зарубежных компаний Имитационное моделирование в фарминдустрии: кейсы зарубежных фармкомпаний на платформе AnyLogic.Цифровизация компаний фарминдустрии в России стремительно набирает обороты.  Один из ее основных трендов — имитационное моделирование бизнес-процессов. Западные фармкомпании ...

Обфускация как метод защиты программного обеспечения Обфуска́ция (от английского obfuscate — делать неочевидным, запутанным, сбивать с толку)  в широком смысле - приведение исходного текста или исполняемого кода программы к виду, сохраняющему её функциональность, но затрудняющему анализ, понимание алгоритмов раб...

TelegramBot. Базовый функционал. Стикеры и смайлы. (Часть 3) Один из вопросов, который часто приходит в личку — как работать со смайлами(эмодзи) и стикерами. Как с ними работать, какими инструментами пользуюсь я и т.д. В данной части будут рассмотрены такие вещи: как создать сообщение со стикером, как обработать полученное сообщен...

Законотворчество и программирование: заметка об интерпретации текстов Все юристы работают с текстами. Читают, пишут, изучают, трактуют, убеждают в своих трактовках. Программисты — работают с текстами. Читают, пишут. Убеждают компилятор в своей правоте. Я — разработчик. Код пишется по некоторым правилам, а потом компилятор его разбирает. Хорошо...

Как навсегда забыть про проблемы с PDF Больше у вас не будет проблем с редактированием PDF Многие научные труды доступны в Сети в формате PDF, и не просто так. В отличие от того же .docx и многих других текстовых форматов, PDF легко открыть, порой для этого не нужно даже скачивать специальное приложение (на Mac п...

Как использовать распознавание звука на iPhone и iPad? Официальное видео Компания Apple опубликовала официальное видео, рассказывающее о функции распознавания звука, которая присутствует на iPhone и iPad. Она находится в меню специальных возможностей, для того, чтобы включить её, необходимо перейти «Настройки» > «Универс...

Нечего надеть? Computer Vision в помощь Привет, Хабр! Меня зовут Роман Тезиков, я Data Scientist, специализируюсь на Computer Vision в Lamoda. В R&D Lamoda мы постоянно имеем дело с различного рода рекомендациями. Когда покупатели не знают, какая вещь им нужна, они формируют ее абстрактный образ и пытаются най...

Bloomberg: Microsoft ведёт переговоры о покупке Nuance Communications Как сообщает агентство Bloomberg, Microsoft ведёт переговоры о покупке компании Nuance Communications, специализирующейся на разработке технологий искусственного интеллекта и распознавания речи. Сообщается, что Microsoft готова заплатить около $56 за акцию, так что общая су...

Обновление Windows 10 представляет новую функцию копирования и вставки Предстоящее обновление функций Windows 10 предназначено для улучшения «Облачного буфера обмена» с поддержкой нескольких функций, включая «вставку как обычный текст», смайлики, GIF-файлы и многое другое. Помимо улучшений в Облачном буфере обмена, Microsoft также тестирует нов...

Как принципы ResponsibleAI помогают ML-моделям работать по максимуму? С помощью ML-моделей сегодня выдают кредиты, регулируют движение на дорогах, определяют цены на товары и многое другое. Однако, процесс их разработки и вывода в продуктивную среду сложен и полон подводных камней. Очень часто качество прогноза, основанного на реальных данных,...

Руководители Google и Microsoft разошлись во мнениях по поводу запрета на распознавание лиц Сундар Пичаи считает, что проблемы нужно решать как можно скорее. По мнению Брэда Смита, запреты — слишком грубый способ их решения. Генеральный директор компании Alphabet и ее дочерней компании Google Сундар Пичаи поддержал предложение Еврокомиссии о временном запрете и...

И снова про капчу Здесь на Хабре часто встречаются статьи про распознавание капчи. Всегда с большим интересом их читал, а сегодня настал и мой черёд написать. Путь от наивной реализации с Тессерактом до веб-сервиса со сложной нейросетью занял у меня около года. Количество ошибок распознавания...

Power-line communication. Часть 1 — Основы передачи данных по линиям электропередач Не так давно передо мной встала нетривиальная задачка — собрать устройство, которое могло бы по линиям электропередач (0,4 кВ), в сетях обычных бытовых потребителей, передавать некоторую информацию, а точнее — показания электросчетчиков. Перед началом работы над создание...

Компьютер распознал прослушиваемую песню по мозгу человека Учёные обучили алгоритм распознавать прослушиваемую песню по активности мозга человека. Точность распознавания составила 85%.

Посчитать рядового пользователя Расхождение законодательства с техническими реалиями стало настолько существенным, что порой нет никакой возможности предсказать правоприменительную практику исходя из текста закона. Эти тексты зачастую являются в большей степени способом коммуникации с окружающим миром, неж...

В регионах запустят сервис для записи к врачу и консультаций Об этом рассказали “Коммерсанту” в министерствах. Первоначально приложение будет доступно для жителей Белгородской и Московской областей и Башкортостана. Тендер на разработку приложения на 101 млн руб. 8 декабря 2020 года выиграл "Ростелеком", обнаружи...

[Из песочницы] В поисках «Годзиллы». Нейросети и прогнозирование котировок на основе биржевых и «внешних» данных Эта работа вдохновлена статьей «Мечтают ли нейросети об электроденьгах?», где автор без преувеличения талантливо в своей доходчивости объясняет, почему использование искусственных нейросетей на голых биржевых данных не приводит к успеху. Вот особенно, на мой взгляд, удачный...

[Перевод] Интерактивные эксперименты с машинным обучением (на TensorFlow) Вкратце Я создал новый проект Интерактивные эксперименты с машинным обучением на GitHub. Каждый эксперимент состоит из Jupyter/Colab ноутбука, показывающего как модель тренировалась, и Демо странички, показывающей модель в действии прямо в вашем браузере. Несмотря на то, чт...

Почему так сложно заметить опечатки в собственном тексте Редакция Вопросы и ответы 09.08.2021, 17:46 Почему так сложно заметить опечатки в собственном тексте Можно написать прекрасный рассказ, статью или деловое письмо. Но все плюсы даже самой безупречной работы перекроет случайная опечатка....

Как пройти проверку на антиплагиат Многие студенты с приближением лета начинают задумываться над вопросом: как пройти проверку на антиплагиат. Обязательный анализ проводится для каждой студенческой работой перед сдачей преподавателю. Обычно в вузах установлена специальная программа, которая обязательно занижа...

В Сколтехе компьютер обучают понимать эмоции людей Ученые провели сравнительное тестирование нескольких ИИ-алгоритмов анализа сигналов электрической активности мозга и поиска в них закономерностей, позволяющие понять состояние человека. Ученые Сколковского института науки и технологий, французского института INRIA и японс...

Копнём поглубже: сравниваем популярные алгоритмы оптимизации с менее известными Привет, Хабр! Меня зовут Мария Белялова, и я занимаюсь data science в мобильном фоторедакторе Prequel. Эта статья открывает наш цикл материалов со сравнением алгоритмов оптимизации для обучения нейросетей. Помимо классических методов, которые давно зарекомендовали себя, м...

TAD Development запустила AI-приложение для расшифровки аудио Новое приложение на базе искусственного интеллекта преобразует в текст аудиозаписи интервью, переговоров, лекций и не только.

Как добавить кодек в FFmpeg FFmpeg — это грандиозный Open Source проект, своего рода мультимедийная энциклопедия. С помощью FFmpeg можно решить огромное число задач компьютерного мультимедиа. Но все-таки иногда возникает необходимость в расширении FFmpeg. Стандартный способ — это внесение изменений в к...

Лучшее о контентной стратегии и текстах на сайт [Исследования и опыт] Как составить стратегию контент-маркетинга и написать качественные тексты на сайт? Обновленная подборка статей с исследованиями и опытом специалистов по SEO.

Google рассказал о своем новом поисковом алгоритме SMITH По словам разработчиков, он превосходит BERT в распознавании документов.

Генерёж для интернет-магазинов и агрегаторов. Как улучшить индексацию и ранжирование Доклад для владельцев сайтов, которые разбираются в SEO и специалистов инхауса и агентств, которые продвигают коммерцию. Расскажу преимущества сгенерированного и шаблонного текста перед текстами копирайтеров, какие механики и инструменты использовать...

Hack The Box — прохождение AI. SQLi в AРI Text To Sрeach, SSH Forwarding и RCE в JDWР Продолжаю публикацию решений отправленных на дорешивание машин с площадки HackTheBox. Надеюсь, что это поможет хоть кому-то развиваться в области ИБ. В данной статье познакомимся с преобразованием текста в голос и найдем SQL иньекцию в AРI, прокинем порт через SSH, а также ...

Redux Toolkit как средство эффективной Redux-разработки В настоящее время разработка львиной доли веб-приложений, основанных на фреймворке React, ведется с использованием библиотеки Redux. Данная библиотека является самой популярной реализацией FLUX-архитектуры и, несмотря на ряд очевидных преимуществ, имеет весьма существенные ...

Флагманские ноутбуки Huawei MateBook X вышли у себя на родине Компания Huawei сегодня начинает продажи флагманских ноутбуков Huawei MateBook X у себя на родине. За версию с процессором Core i5, а также 8/512 ГБ просят 1155 долларов. Версия с Core i5, 16/512 ГБ стоит 1300 долларов, а с Core i7, 16/512 ГБ — 1445 долларов....

Оптимизация dotMemory с использованием dotMemory (и не только...) dotMemory — это профилировщик памяти для .NET от компании JetBrains. А меня зовут Илья, и я из команды разработки этого инструмента.Хочу поделиться историей классического догфудинга: как мы оптимизировали один из алгоритмов в dotMemory с помощью своих же инструментов — dotMe...

Артур Хачуян: «Настоящая Big Data в рекламе» 14 марта 2017 года в лектории BBDO выступил Артур Хачуян, генеральный директор Social Data Hub. Артур рассказал про интеллектуальный мониторинг, построение поведенческих моделей, распознавание фото- и видеоконтента, а также о других инструментах и исследованиях Social Data H...

Проектируем мультипарадигменный язык программирования. Часть 6 — Заимствования из SQL Продолжаем рассказ о создании мультипарадигменного языка программирования, сочетающего декларативный логический стиль с объектно-ориентированным и функциональным, который был бы удобен при работе со слабоструктурированными данными и интеграции данных из разрозненных источник...

Нет, PlayStation 5 не выйдет в октябре. Sony опровергла эту информацию, заявив об ошибке Сегодня в Сети появилась информация о том, что консоль Sony PlayStation 5 может быть представлена раньше, чем утверждали все предыдущие слухи — в октябре. Об этом прямым текстом было сказано в вакансии, которую разместила сама Sony. концепт Впрочем, мы сразу огов...

По прогнозу Juniper Research, к 2025 году более 1,4 млрд человек будут пользоваться распознаванием лиц для аутентификации платежей Исследование, проведенное аналитиками Juniper Research, позволили им высказать следующий прогноз: во всем мире число пользователей программного обеспечения распознавания лиц для безопасных платежей к 2025 году превысит 1,4 млрд. Для сравнения — в прошлом году таки...

Четыре приема, которые ускорят оформление чертежей В nanoCAD есть небольшие хитрости, позволяющие сократить время оформления таблиц и выносок. Автозаполнение ускорит ввод в таблицу числовых данных. Применение преднастроенных стилей позволит за считанные секунды оформить границы таблиц в соответствии с ГОСТ. Внедрение геометр...

ВТБ подвел результаты полутора лет технологической трансформации В рамках реализации технологической трансформации ВТБ: перевел мобильный банк на новую ИТ-архитектуру, что позволило увеличить скорость работы ВТБ Онлайн вдвое и ускорить время отклика интерфейсов в 10 раз; вывел на новый уровень надежность систем при росте числа внедрений и...

По всей России появится видеослежка с распознаванием лиц Распознавание осуществляется не только по лицу, но и по фигуре и другим особенностям человека, поэтому от него невозможно «спастись» надев маску или укутавшись шарфом.

[Перевод] Энтерпрайзные проекты убили профессию разработчика От переводчика: Фокусом нашей компании всегда была именно разработка корпоративных приложений. В Haulmont мы занимаемся как созданием собственно приложений, так и инструментов, позволяющие разработчикам эффективнее решать задачи, связанные с разработкой таких систем. Наприм...