Содержание

Как по IP узнать доменное имя

Если изначально разобраться, в чем кроется разница между именем сайта и его IP-адресом, можно легко по этому самому IP-адресу узнать имя сайта. Не всем пользователям Всемирной паутины известно, что сайт в Интернете имеет несколько имен (как минимум — два). Первое имя (название) легко узнаваемо и привычно пользователю: mail.ru, vk.com, wikipedia.org и др. Его также называют URL или «доменное имя».

За оболочкой видимого и понятного скрывается обратная сторона – техническая. С этой стороны компьютеры имеют дело с именем сайта, более понятным для них, которое как раз и является IP-адресом. Именно это, скажем так второе «техническое», имя сайта и является его настоящим названием в сети Интернет. Например, IP-адрес сайта yandex.ru – 5.255.255.5.

DNS-сервер (такое специальное приложение) сначала ищет IP-адрес, который введен пользователем в любом удобном браузере, и только потом показывает нужное содержимое. Техническая сторона поиска происходит мгновенно – поэтому и не заметна для человека. Таким образом, напрашивается вывод, что IP-адрес – это индивидуальный определитель любого сайта в сети Интернет.

Узнать доменное имя по IP

Параллельно возникает вопрос: если узнать адрес IP по названию сайта достаточно легко, можно ли осуществить поиск наоборот? То есть найти нужный сайт по его IP-адресу. Ответ будет положительным, такой поиск возможен, но не без специального «помощника». Ресурс Whoer.net, позволяет в несколько простых шагов достичь нужного результата:

  1. Открыть сервис WHOIS в удобном браузере;
  2. Ввести в верхнем окне адрес IP;
  3. Ниже в строке «хост» отобразится соответствующее имя сайта.

Если, в качестве примера, ввести выше названный IP-адрес 5.255.255.5, то в строке «хост» увидим имя «yandex.ru».

Разобранную ситуацию с поиском сайта по IP-адресу не будет лишним дополнить таким понятием, как «история IP-адресов сайта». К примеру, если у домена (сайта) меняется владелец, то у него зачастую меняется и IP-адрес, так как собственник работает с каким-то другим хостингом. Ситуация встречающаяся реже – сам хостинг меняет у сайта-клиента IP-адрес. В этом случае адреса-IP могут быть разными, но имя сайта останется прежним.

Как узнать владельца домена | FORNEX

Whois базы

Согласно интернет-корпорации ICANN cервис WHOIS — бесплатный общедоступный каталог, содержащий контактную и техническую информацию о зарегистрированных владельцах доменных имен. Все желающие узнать о том, кто стоит за сайтом или доменным именем могут провести соответствующий поиск по службе каталогов WHOIS.

Whois — сетевой протокол, который используется для получения регистрационных данных о владельце доменного имени. Whois протокол может использовать только ту информацию, которая находится в свободном доступе регистраторов доменных имен, потому для некоторых доменов информация может быть неполной или скрытой. Это связано с настройками приватности конкретного домена.

Whois информация содержит:

  • дату регистрации
  • информацию о ns-серверах
  • компанию-регистратора доменного имени
  • контактные данные владельца домена
  • адрес владельца домена
  • ряд другой технической информации

Таким образом, обязательным правилом регистрации домена является указание своей контактной информации, которая хранится у регистраторов доменных имен, а также содержится в whois-базах (многие сервисы предоставляют возможность просмотра этой информации), открытых для всех желающих.

Этих баз с информацией о доменах множество и они обновляются по мере обновления информации о домене.

Наиболее популярными являются:

Это общие базы для всех доменных зон, но бывают и whois-базы для определенных доменных зон. Например:

  • nic.xyz/whois — для доменов в зоне .xyz
  • whois.mynic.my — для доменов в зоне .my
  • hostmaster.ua/?domadv — рекомендуем использовать этот сервис для проверки доменов в украинских зонах.

Также рекомендуем проверять домен в нескольких базах сразу для получения достоверной информации, т.к. данные этих ресурсов обновляются с различной частотой.

Принцип использования:

  • В поле поиска указываем домен, владельца которого необходимо найти
  • Нажимаем кнопку «Показать»/Найти» или подобную

В результате будет подобный результат:

Нас интересует раздел «Registrant»

— в нем находится вся информация о владельце домена:

Чаще всего информация предоставляется блоками и в блоке «REGISTRANT CONTACT» отображается вся необходимая информация, включая имя, фамилию, email, телефон.

В случае использования Linux ОС или Mac ОС узнать информацию о домене можно, открыв консоль Terminal и написав команду:

whois domain.com  

Если контактная информация скрыта для искомого домена включена «whois защита данных» то в контактной информации необходимо найти поле Registrant email — строка «Email» в разделе «Registrant»
Пишем на него письмо и ждем ответа: владелец получит это письмо на email, указанный при регистрации домена

Поиск по email

Этот способ не позволяет узнать имя и фамилию владельца домена, но позволяет связаться по email с ним.

В связи с этим можно найти созданные почтовые ящики и попытаться связаться с владельцем через них

Перечень популярных имен для почтовых ящиков :

Как узнать ip домена или сайта

Всякий сайт имеет доменное имя (домен). Существуют какие-то странные сервисы, которые используют ваше неведение в своих (как правило корыстных) целях.   Для того чтобы узнать ip сайта не нужны никакие сервисы. Все что вам для этого нужно — уже у вас под рукой. Позвольте я вам немного подробно расскажу как вообще работает эта система сайт-домен и ip-адрес. Ибо все достаточно просто.

Если начинать с самого начала — получится слишком много информации. Вам это скорей всего не нужно. Однако о базовых принципах в двух словах упомянуть стоит.

Как определяется IP по доменному имени сайта?

Итак, мы запоминаем сайты по доменным именам. И не только мы, вообще весь интернет это множество доменных имен. Однако сами компьютеры и другое сетевое оборудование общаются между собой по ip-адресам. Вы наверняка имеете представление о том что это и зачем нужно, раз уж задались целью определить ip-адрес сайта.  Практически любой компьютер (или другое сетевое устройство — планшет, смартфон) и любая операционная система, которая на него установлена УЖЕ умеет определять ip-адрес любого домена, и соответственно, сайта.


DNS

Все дело в том, что для определения ip по именам  отвечает технология  DNS. Возможно вы встречали что-то вроде «ошибки поиска dns» или «temporary failure in name resolution». Есть и другие формулировки, но это все одна и та же ошибка — невозможно преобразовать имя сайта (домен) в ip-адрес. Но раз когда это невозможно и мы получаем ошибку, а обычно ошибки нет — значит компьютер обычно может преобразовывать имена в ip-адреса.

Это действительно так. Ваш компьютер уже знает или может узнать без каких-либо онлайн-сервисов ip сайтов и доменов.

Как этим воспользоваться?

Расширение — узнать ip адрес сайта Chrome

Суть — обратиться к DNS серверу. Только так, и никак иначе, других способов НЕ СУЩЕСТВУЕТ. Существование интернета невозможно без этих серверов. Всякий раз, когда вы набираете адрес сайта в браузере происходит именно это — ваш компьютер обращается к ближайшему DNS  и спрашивает у него ip-адрес этого сайта. Если ближайший DNS не знает ответа — он обратится к другим ДНС о которых ему известно, получит ответ от них и передаст его вашему компьютеру.  Компьютер получает ответ и направляет вас на этот сайт устанавливая соединение с полученным ip-адресом. Так работает не только браузер. А любая программа, которая может работать по сети.

И если мы какими-нибудь диагностическими утилитами начнем просматривать сетевые соединения — мы увидим все ip-адреса и даже порты к которым подключены.

Узнать адрес сайта в Firefox поможет Firebug

А еще можем открыть отладчик браузера и увидеть ip-адреса сайтов там. Вы можете видеть на скриншоте как это сделать в Firefox. Отладчик Firebug запускается клавишей F12 (детально о назначении функциональных клавиш,вы можете узнать в этой статье).  А еще в логах веб-серверов и прокси-серверов. А еще… да много где. Все эти сложности ни к чему, если вам нужно просто узнать ip сайта или домена. И рассказал я вам об этом, лишь для полного понимания — что способ на самом деле только один — через DNS.

Рассказал для того, чтобы стало ясно, что узнать ip можно в любой момент со своего компьютера простейшими утилитами ping и nslookup. Эти утилиты есть на каждом компьютере.  И использовать их крайне просто. Достаточно открыть командную строку (win+R > cmd) и написать в ней «команда имя_сайта.ru».

Например так:

ping mail.ru
PING mail.ru (94.100.180.200) 56(84) bytes of data.
64 bytes from cp.mail.ru (94.100.180.200): icmp_seq=1 ttl=53 time=94.3 ms
64 bytes from cp.mail.ru (94.100.180.200): icmp_seq=2 ttl=53 time=94.0 ms
64 bytes from cp.C
— mail.ru ping statistics —
4 packets transmitted, 4 received, 0% packet loss, time 3004ms

rtt min/avg/max/mdev = 93.958/94.605/96.116/0.908 ms

Здесь мы получаем множество другой отладочной информации — но самое главное четко виден ip-адрес сайта.
Точно так же мы используем и другую утилиту — nslookup.

Использование Nslookup

Это старейшая утилита командной строки для работы с DNS. Простой пример использования можете видеть ниже — nslookup <адрес сайта>

nslookup mail.ru
Server:        127.0.1.1
Address:    127.0.1.1#53

Non-authoritative answer:
Name:    mail.ru
Address: 94.100.180.200
Name:    mail.ru
Address: 217.69.139.200
Name:    mail.ru
Address: 94.100.180.202
Name:    mail.ru
Address: 217.69.139.202

или так:

C:Usersadmin>nslookup mail.ru
DNS request timed out.
timeout was 2 seconds.
╤хЁтхЁ:  UnKnown
Address:  192.168.5.1
Не заслуживающий доверия ответ:
╚ь :     mail.ru
Addresses:  217.69.139.200
94.100.180.202
217.69.139.202
94.100.180.200

Что здесь означает «не заслуживающий доверия ответ»? Это всего лишь то, что в качестве DNS-сервера используется хост, не являющийся публичным. Который стоит скорее всего где-то в вашей локальной сети. Это может быть даже просто шлюз, wi-fi роутер (как в нашем примере) — в него обычно встроена функция ретрансляции ДНС-запросов. На самом деле этот ответ приходит от внешнего ДНС-сервера, которому можно доверять.

Вот те раз! 4 адреса?  Ответ уже другой и требует пояснений.  Несколько ip-адресов — это  нормально для крупных сайтов, каковым безусловно является mail.ru.  Попробуйте узнать ip Google или Вконтакте. Так происходит потому, что эти сайты обслуживают множество пользователей и чтобы справляться с большим потоком они располагаются на нескольких серверах в интернете, а их доменное имя направлено ip-адреса этих нескольких серверов. Для пользователя неважно на какой из ip он попадет.

Имеет место также  и обратное явление — когда на один ip-адрес направлены несколько доменов. Это обычная ситуация для виртуальных хостингов — на одном сервере могут находиться множество сайтов, и все их домены будут вести на IP одного сервера.

Первая строка в ответе nslookup означает не что иное как адрес ближайшего по отношению к вам DNS. При необходимости его можно изменять и обращаться к какому-то конкретному серверу, например к публичному DNS Google  8.8.8.8. Но это обычно бывает необходимо только системным администраторам для диагностики и анализа.

Стоит ли говорить, что абсолютно любые программы и онлайн сервисы для определения IP тоже используют ping и nslookup? Кроме того, есть еще один очень мощный инструмент dig, который является аналогом nslookup. Он более новый и доступен только в nix-системах.

В чем разница между ping и nslookup при определении IP?

Повторюсь, на самом деле в них встроен одинаковый механизм. Nslookup это довольно мощный инструмент который предназначен непосредственно  для подобных запросов и отображает более полную и подробную информацию. Ping же не всегда покажет вам ответ в виде echo-пакетов, однако ip-адрес она определит если это возможно. Ну и как видно из примера — ping сработает как браузер, и покажет вам только тот ip, который  был выбран DNS-балансировщиком  именно на ваш запрос.

Вообще тема определения IP очень обширна. О DNS написаны целые книги, используются громадные мощности. Это целая отрасль в администрировании, фундаментальные основы которой я постарался кратко описать и надеюсь у вас больше никогда не возникнет проблемы с определением ip адресов сайтов и доменов.

Как проверить, не находится ли ваш домен в черном списке?

Если вы не используете специальные сервисы для отправки массовых рассылок, вам придется проверять, не находится ли ваш домен в черном списке. Email платформы заботятся о репутации отправителя и используют только надежные серверы. Если вы хотите отправлять рассылки самостоятельно, следуйте этой инструкции, чтобы проверить домен.

Используйте MxToolbox, если у вас есть проблемы с доставкой писем. Этот инструмент поможет вам узнать, какая репутация у нужного для вас домена и кто отправляет с него письма. MxToolbox проверит ваш домен по более чем 100 черным спискам.

Выберите опцию Blacklists

Впишите свой домен

Вставьте ваш IP адрес или домен и нажмите «Blacklist Check».

Получите результаты проверки

С помощью результатов проверки вы узнаете о возможных причинах попадания в определенный черный список.

Отправьте запрос на удаление из черного списка

Если ваш домен находится в черном списке, отправьте запрос, чтобы его оттуда убрали, но прежде, исправьте все нарушения и опишите их в этом запросе.

Другие инструменты

  • SPAMHOUSE
  • AntiSpamSniper
  • Dnsbl.info
  • UltraTools
  • MultiRBL
  • BLACKLISTALERT

Если вы хотите убедиться, что отправка писем через сервисы рассылок упрощает маркетинг, попробуйте SendPulse!

Доставляемость писем в SendPulse

Репутация домена и IP адреса влияют на этот показатель. Отправляйте рассылки через наш сервис и не волнуйтесь о доставляемости писем — мы позаботимся о технической стороне вопроса. Сконцентрируйтесь на создании оригинальных писем и уникальных предложений, а мы доставим ваши рассылки точно во Входящие. Если у вас до 500 подписчиков, воспользуйтесь нашим бесплатным тарифным планом и отправляйте 15,000 писем совершенно бесплатно каждый месяц!

Отправить рассылку бесплатно

Обновлено: 03.12.2019

Как узнать данные DNS домена

DNS o Система доменных имен (Система доменных имен), Это сложный и иерархическая система, которая помогает коррелируют в IP-адреса Интернет с их соответствующими машины или серверы, через по сети.

Т.е., Когда мы пишем в любой поисковой системе домен, Например: HTTPS://Профессор falken.com, в Система доменных имен отвечает за Перевести такие URL-АДРЕС их соответствующие IP-адрес, для того, чтобы таким образом сделать Маршрутизация запрос через сеть, пока вы не достигнете сервера назначения.

Каждый Операционная система имеет свои собственные средства чтобы узнать различные сведения о домене и, в этом случае, из DNS. Мы будем видеть, как мы можем видеть эту информацию в операционных системах Linux.

 

Как узнать данные DNS домена

 

В Linux Есть Утилита Вызовите консоль хост Это позволяет нам Новая информация на домен, который вы хотите. В этом случае мы увидим, как мы можем запросить информацию DNS из определенного домена:

Шаг 1. Открывает окно Консоль или терминал.

Шаг 2. Вы выполните следующую команду команда:

На основе информации о DNS, вы хотите знать, Вы можете Измените значение NS чтобы узнать другие значения: Кому, AAAA, TXT, …

Различные применимых записей DNS:

  • Кому – или адреса, отвечает за сопоставить IP с одним конкретной машины где же службы, размещенные. Они используются для адресов ИП v.4.
  • AAAA – Аналогично предыдущему, Связывание IP с особым машина, только что IPs направления ИП v.6, они являются новое поколение IPS, С предыдущей версии, ИП v.4, Он пришел к предел машины, которые могут выдержать.
  • MX – o Обмен почтой (Обмен почтой), находятся в перенаправление почты, из данного домена, ответственность за их управления серверами.
  • CNAME – o Каноническое имя, отвечает за Ссылка различные псевдоним домен, соответствующие каноническое имя. Используется для поддомены.
  • NS – o Имена серверов, они отвечают за определение того, что серверы они будут иметь Сведения о DNS домен. Как правило, имеют два, один Главная и другие вторичный, чтобы избежать невозможности доступа в случае что одно является недействующим.
  • TXT – обеспечивает Информация, в текстовом формате, для чтения или не лицом, о домене, к источникам Внешние в то же.

Если вам нужны какие-либо виды сведения о DNS домен, Вы можете просто использовать команду хост ранее прокомментировал, с одним из записи которые хотят получить такую информацию.

 

Присоединиться к вам к каналу Телеграмма

Оставьте нам комментарий или ввестиФорум

Родственные статьи

Как узнать реальный возраст сайта?

Возраст домена и возраст сайта — есть ли отличия?

Следует провести параллель между разницей в возрасте сайта и возрастом домена. Возраст домена – это время, прошедшее с момента его первой регистрации. А вот возраст сайта принято отсчитывать с момента публикации первого поста.

При seo — аудите возраст сайта является важным статистическим показателем. Считается, что возраст сайта влияет на его ранжирование в поисковых системах.

Поисковики лучше относятся к сайтам, имеющим возраст от восьми месяцев и выше, чем к «молодым сайтам». В связи с этим, общие затраты на раскрутку более возрастного сайта меньше, чем сайта с недавно зарегистрированным доменом.

Дату регистрации домена можно узнать по ссылке https://www.nic.ru/whois/. Вводим домен сайта, к примеру: canalsystem.ru. Ресурс нам выдает что сайт зарегистрирован: 2013.03.11.

Возраст домена и возраст сайта это не одно и тоже. Для того, чтобы узнать возраст сайта — фактическую дату индексирования страницы Яндексом, нужно воспользоваться специальным сервисом — www.archive.org.

Вводим адрес сайта в строку анализа сайта. Ресурс выдает информацию о том, что и когда было сделано с сайтом. И мы видим, что сайт был запущен 28.05.2013 года.

Выводы: Домен canalsystem.ru был зарегистрирован: 11.03.2013

Выведен в сеть интернет до 28.05.2013

Сайту canalsystem.ru – почти 4 года.

Полезные бонусы:

Так же есть несколько хороших бонусов на ресурсе www.archive.org. Кликнув на подсвеченную дату в календаре, нам выдастся первая версия сайта. К примеру сайт: canalsystem.ru

Так выглядел сайт в 2013 году:

А уже с сентября 2014 сайт «вздохнул» новой жизнью:


Так же, чуть ниже, мы можем узнать кто занимался сайтом.

К примеру, сайтом canalsystem.ru вначале занималась web студия: megagroup.ru.

Затем сайт был разработан и запущен компанией: seolt.ru

Бывает так, что Яндекс не выдает информацию по сайту.

Это означает, что скорее домен индексируется Яндексом с www. Достаточно вбить строку: url:www.prodaja-betona.ru. Если Яндекс и в таком варианте не находит результатов, значит сайт не проиндексирован Яндексом вовсе.

Ваш вопрос: Как узнать домен по IP cmd?

Как узнать имя своего домена?

Как определить домен

  1. Найдите на своём компьютере «Этот компьютер».
  2. Нажмите на правую кнопку мыши и выберите «Свойства».
  3. Там в блоке «Имя компьютера, имя домена и параметры рабочей группы» будет написан домен.

Как узнать имя компьютера по ip адресу в локальной сети?

Чтобы узнать имя компьютера по ip адресу в локальной сети необходимо в вашей операционной системе нажать пуск — выполнить, после чего напишите cmd. В открытом окне командной строки напишите команду ipconfig. Вывод этой команды покажет напротив поля желаемый ip-адрес компьютера. Напишите tracert<пробел>ip-адрес.

Как узнать IP адрес или доменное имя компьютера?

Узнать доменное имя по IP

  1. Открыть сервис WHOIS в удобном браузере;
  2. Ввести в верхнем окне адрес IP;
  3. Ниже в строке «хост» отобразится соответствующее имя сайта.

Как узнать ip адрес сайта через командную строку?

Чтобы это сделать вам нужно открыть командную строку. Для этого нажмите комбинацию клавиш Windows+R и в появившемся окне введите команду CMD. После этого перед вами должна появиться командная срока. Теперь вам нужно просто ввести команду PING и через пробел указать название сайта, IP адрес которого вы хотите узнать.

Как узнать имя своего узла?

Поиск с помощью командной строки (только Windows)

  1. Откройте окно командной строки, выбрав Пуск > (Все) Программы > Стандартные > Командная строка. Примечание. …
  2. Введите ipconfig /all и нажмите клавишу ENTER. Имя хоста отображается в верхней части в области Настройка протокола IP для Windows.

Как узнать имя домена через командную строку?

Как узнать доменное имя по IP-адресу и IP по домену

  1. Откройте поиск и найдите cmd — командную строку Windows.
  2. Введите в открывшемся окне nslookup yandex.ru. Команда примет вид: C:UsersAdminnslookup yandex.ru. Вместо Яндекса можно вписать любой другой сайт.
  3. Нажмите Enter, и вы получите ответ как на скриншоте.

2.11.2018

Как узнать имя хоста по IP?

Как узнать имя компьютера по IP адресу в сети

Для этого нужно запустить командную строку и выполнить команду «ping -a 192.168.1.1», где «192.168.1.1» — это IP адрес имя которого нужно узнать. При использовании параметра «-a» система выполнит команду Ping с выводом сетевого имени компьютера.

Как узнать IP адрес по имени хоста?

Запустите «Командную строку» от имени администратора. Введите команду «tracert» без кавычек и через пробел укажите IP-адрес интересующего компьютера. Нажмите Enter, в окне отобразится имя. Если нужно узнать имя собственного компьютера, целесообразнее воспользоваться командой «hostname».

Как узнать DNS имя компьютера по ip?

Если вы хотите узнать DNS вашего компьютера, существует несколько способов это сделать. Первый самый быстрый и простой. Сначала откройте командную строку (чтобы сделать это воспользуйтесь комбинацией клавиш Win+R и пропишите cmd в поле для ввода, далее щёлкните по кнопке «ОК»), а затем выполните команду ipconfig/all.

Как выглядит IP адрес сайта?

IPv4. В 4-й версии IP-адрес представляет собой 32-битное число. Как правило, адрес записывается в виде четырёх десятичных чисел значением от 0 до 255 (эквиваленты четырём восьмибитным числам), разделённых точками, например, 192.168.0.3 .

Как по ip адресу узнать порт?

Как узнать свой порт на ПК с Windows

  1. Откройте командную строку
  2. Введите ipconfig.
  3. Далее введите netstat -a, после чего откроется список ваших номеров портов

Как найти IP адрес компьютера?

Вы можете легко узнать ваш собственный IP-адрес

Откройте CMD: для этого одновременно нажмите [Win] + [R]. В появившемся окне введите «cmd» и подтвердите выбор, нажав на «OK». Теперь введите «ipconfig» в командной строке. Ваш IP-адрес можно найти в поле «IPv4-адрес».

Как узнать IP адрес любой страницы в интернете?

Узнать IP адрес любого интернет сайта можно очень просто. Первый способ – это воспользоваться командной строкой Windows, введя в нее знакомую многим команду ping. Второй вариант – использование специализированных сайтов, предоставляющих такую информацию.

Как узнать внешний IP адрес через командную строку Windows?

Открываем окно Выполнить (Win+R), пишем cmd и нажимаем Enter. Вводим команду ipconfig и снова Enter. Для более подробных сведений запустите команду с параметром /all, как показано на скриншоте. IP адрес и все остальные значения, вместо вывода на экране будут отправлены прямо в файл ip.

Все, что вам нужно знать о доменных именах

Независимо от того, запускаете ли вы свой первый веб-сайт или работаете над расширением существующего, ваше доменное имя является центральным фактором. Это важно с технической точки зрения, поскольку упрощает доступ пользователей к вашему сайту, но также важно для вашего цифрового бренда.

Поскольку понимание доменных имен так важно для владельцев и менеджеров веб-сайтов, мы собрали ряд часто возникающих вопросов, чтобы вы могли узнать все, что вам нужно знать.

Давайте нырнем!

Подпишитесь на наш канал Youtube

Что такое доменное имя?

Вы можете этого не осознавать, но вы, вероятно, уже хорошо знакомы с доменными именами. Это URL-адреса, которые вы вводите в браузере для доступа к знакомым веб-сайтам. Например, для этого сайта номер elegancethemes.com .

Основная цель доменного имени — действовать как адрес вашего веб-сайта. Каждый компьютер, включая сервер, на котором размещен ваш веб-сайт, имеет IP-адрес, состоящий из последовательности чисел.Без доменных имен пользователям придется вводить IP-адрес вашего сервера для доступа к вашему сайту.

Вместо этого ваш веб-адрес предоставляет легко запоминаемые альтернативные пользователи, которые могут быстро войти, чтобы получить доступ к вашему содержанию. Если вы выберете его с умом, это также поможет закрепить ваш бренд в сознании посетителей, чтобы они лучше с ним познакомились.

Что такое система доменных имен (DNS)?

Чтобы понять все тонкости работы доменных имен, вам необходимо знать о DNS.Это децентрализованная система, в которой хранится информация о том, какие домены к каким IP-адресам подключены.

Когда пользователь вводит ваше доменное имя в своем браузере, он затем проверяет DNS на соответствующий IP-адрес и направляет посетителя на нужную страницу. В этом смысле вы можете думать о DNS как о каталоге в Интернете.

Существует несколько сценариев, в которых вам может потребоваться прямое взаимодействие с DNS, например, устранение неполадок или настройка настраиваемого адреса электронной почты.Это также важно при переносе вашего сайта на новый домен или к новому хостинг-провайдеру.

Чем доменное имя отличается от веб-хостинга?

Доменные имена и веб-хостинг часто смешиваются, потому что многие хостинг-провайдеры также являются регистраторами доменов, и для запуска веб-сайта требуются обе службы. Однако это совершенно разные концепции.

Ваш домен, как мы уже объясняли, является адресом вашего веб-сайта. Ваш веб-хостинг предоставляет сервер вашего веб-сайта, который похож на его дом.Хотя вы можете приобрести хостинг и домен у одной и той же компании, это не обязательно.

Что такое домен верхнего уровня (TLD)?

TLD — это конечная часть доменного имени, например .com . Один TLD работает не лучше, чем другой, когда дело доходит до предоставления пользователям доступа к вашему сайту, но между ними есть ключевые различия.

Например, ваш TLD может указывать на природу вашего веб-сайта. Например, .org традиционно используется для некоммерческих организаций.Новые TLD, такие как .blog или .shop , могут использоваться для концентраторов контента и сайтов электронной коммерции. Другие, а именно .gov и .edu , требуют дополнительной проверки, поскольку они указывают на определенный уровень полномочий.

Ваш TLD также может влиять на стоимость вашего доменного имени. В то время как адреса .com стоят около 10 долларов в год, домен .inc стоит несколько тысяч.

Что такое субдомен?

Если вы знакомы с мультисайтами WordPress, возможно, вы встречали термин «субдомен».Это URL-адрес определенной части веб-сайта или «микросайта» в сети. Он обозначается префиксом, например blog.example.com .

Поддомены рассматриваются поисковыми системами как полностью отдельные веб-сайты и имеют множество применений, особенно когда речь идет о структурировании более крупных сайтов. Обычно вы можете настроить их через панель управления вашего хостинг-провайдера.

Как выбрать доменное имя?

Вообще говоря, ваше доменное имя должно соответствовать вашему веб-сайту, бренду или названию компании.Это сводит к минимуму путаницу среди посетителей и обеспечивает столь необходимую единообразие.

Однако, если вы только начинаете или ваше идеальное доменное имя уже выбрано, есть несколько мест, где вы можете найти вдохновение, например, автоматические генераторы доменных имен. Не забудьте сделать его уникальным, кратким и запоминающимся.

Вы можете проверить, какие домены доступны, перейдя на сайт любого регистратора и воспользовавшись его функцией поиска:

Если ваш первый вариант недоступен, регистратор может даже предложить аналогичные альтернативы, чтобы помочь вам найти другую, которая будет соответствовать вашим потребностям.

Где купить доменное имя?

Вы можете купить доменное имя у любого регистратора доменов. Как мы упоминали ранее, многие веб-хосты выступают в роли регистраторов, но вы также можете выбрать источник своего хостинга и домена от разных компаний.

Вы можете рассмотреть два популярных регистратора

Namecheap и GoDaddy. Однако покупка домена у вашего хостинг-провайдера обычно упрощает настройку вашего первого веб-сайта. Многие организаторы также добавят вашу регистрацию на первый год бесплатно при покупке плана (хотя вам все равно придется платить ежегодную плату за продление).

Что такое конфиденциальность домена?

Когда вы покупаете доменное имя, вы регистрируете его как часть общедоступной записи. Интернет-корпорация по присвоению имен и номеров (ICANN) отвечает за ведение справочника владельцев каждого доменного имени в Интернете.

Тем не менее, записи ICANN включают вашу контактную информацию, которая может не разглашаться. При покупке домена конфиденциальность хранит ваши личные данные в секрете, поэтому они не будут отображаться в этой записи.

Конфиденциальность домена также иногда называют защитой WHOIS. Обычно он предлагается в качестве надстройки во время оформления заказа при покупке доменного имени:

Некоторые регистраторы, такие как Namecheap, бесплатно включают защиту WHOIS (или, точнее, включают ее в стоимость вашего домена). Другие могут указать это как отдельную плату, но ваша конфиденциальность стоит вложений.

Можете ли вы продать доменное имя?

Если вы решите, что вам больше не нужно или вам больше не нужно зарегистрированное доменное имя, вы можете его перепродать.Flippa — популярная торговая площадка для продажи «цифровой недвижимости»:

Однако вы также можете работать с брокером или продать свое доменное имя с аукциона. На сумму, которую вы можете получить за свой веб-адрес, будут влиять несколько факторов, например:

  • Какой TLD использует
  • Если в нем есть ценные ключевые слова
  • Как он узнаваем

Если вы также продаете веб-сайт, созданный на своем домене, могут иметь значение и другие факторы, такие как уровень трафика и опубликованный вами контент.

Заключение

Несмотря на то, что в мире доменных имен задействовано множество различных элементов, на самом деле они довольно просты для понимания. Узнав о них все, что вы можете, в конечном итоге окупится, так как это поможет вам лучше создавать, поддерживать и даже продавать свой веб-сайт.

В этом посте мы рассмотрели много информации о доменных именах, в том числе о том, что они собой представляют и как работают. Мы также дали несколько советов по их выбору, покупке и продаже.

У вас есть вопросы по доменным именам? Оставьте их нам в разделе комментариев ниже!

Изображение VectorsMarket / shutterstock.com

Шесть шагов к созданию экспертных знаний в сложной отрасли | Маргарет Гулд Стюарт | Facebook Design: Business Tools

Около четырех лет назад я решил сделать решительный шаг и присоединиться к группе Facebook Ads & Pages, чтобы помочь создать команду дизайнеров для этой важной области бизнеса.Я знал, что это одна из самых больших дизайнерских возможностей в отрасли, и я был взволнован, узнав что-то новое. Раньше я никогда не работал с рекламой, но был довольно умен и имел хорошую репутацию. Как трудно это может быть?

Вскоре после того, как я присоединился к команде, я помню, как сидел на собрании персонала и слушал, как один из моих коллег обсуждает особенности конкретного проекта. Я сидел на этом собрании и на бесчисленном множестве других в течение моих первых нескольких недель и месяцев, чувствуя себя, ну, очень похожим на эту собаку…

Меня нарисовал художник

… счастлив и полон энтузиазма, но несколько невежественен. В то время я поймал себя на мысли: «Я, должно быть, , всего лишь человек на этой встрече, который не понимает, что это значит».

Спойлер: вы почти НИКОГДА не единственный человек, который не понимает чего-то сложного.

Возможно, вы единственный человек, достаточно храбрый, чтобы признать это и попросить помощи или разъяснений. В то время как я был взволнован возможностью в этом новом загадочном мире, я чувствовал себя немного ошеломленным.Потому что, хотя я умный, опытный и опытный дизайнер, оказывается, что цифровая реклама — это сложно. Людям, пытающимся использовать инструменты, трудно, и людям, пытающимся создать лучшие инструменты.

Отрасль настолько сложна, с таким количеством участников, у которых часто не совпадают стимулы, что понять, что делать, сложно, а выяснить, как это сделать, может быть еще сложнее. Но если есть что-то, чему я научился за последние 20 с лишним лет в технологической индустрии, так это то, что бесплатного обеда не бывает.Невозможно добиться значительного устойчивого воздействия без решения некоторых действительно сложных проблем. И улучшение работы рекламы для бизнеса и миллиардов людей во всем мире — это то, что определенно стоит моего времени и сил.

Когда я разговариваю с потенциальными дизайнерами и исследователями продуктов, их часто волнуют проблемы, которые представляет цифровая реклама, но иногда они беспокоятся, что у них ничего не получится из-за отсутствия у них опыта в данной области. И я полностью это понимаю.Моя команда сильно выросла за последние четыре года. По моим оценкам, около 90% из них не имели опыта работы в цифровой рекламе, прежде чем совершили такой же прыжок веры, как и я. Никто не любит долгое время оставаться в неведении. Мы все хотим чувствовать, что работаем над достижением состояния творческой уверенности, когда мы можем иметь хорошо обоснованные мнения, которые помогут продвинуть нашу дизайнерскую работу в правильном направлении.

Итак, как я избавился от чувства, что не знаю, что делаю?

И как помочь новым дизайнерам и исследователям, которые присоединяются к нашей команде, как можно быстрее пройти этот этап? Мы очень серьезно подошли к тому, как привлечь новых членов команды.

Я хочу поделиться с вами некоторыми методами, которые я считаю наиболее эффективными. Некоторые из них кажутся довольно очевидными, но некоторые могут быть менее интуитивными. Все, что поможет побудить больше дизайнеров заниматься этими недостаточно обслуживаемыми и сложными областями, — это хорошо. И я говорю не только о цифровой рекламе — хотя мне она очень нравится, и мы нанимаем! — но также в таких областях, как образование, здравоохранение, финансовые услуги и правительство.

Вам не нужно быть экспертом в этих отраслях, чтобы увеличить добавленную стоимость или сделать отличную работу.Фактически, ум вашего новичка может быть огромным преимуществом для команды, которая действительно хочет изменить то, как все работает. Что — это , так это способность и страсть к решению сложных проблем, смирение, чтобы знать то, чего вы не знаете, и навыки совместной работы для тесного сотрудничества со знающими коллегами. Ты можешь сделать это! И вы должны это сделать, потому что эти отрасли требуют большего лидерства в области дизайна.

Итак, независимо от того, попали ли вы в новую, сложную область или планируете погрузиться в одну, я надеюсь, вы найдете эти 6 методов полезными в получении ваших морских ног…

В каждой отрасли есть свои лидеры мнений.Спросите самые блестящие умы — как людей, которых вы знаете, так и лидеров отрасли, с которыми вы можете связаться через социальные сети, — кого они сначала читают, чтобы узнать о предметной области, и что бы они порекомендовали кому-то новичку в этой сфере. Некоторые источники могут быть новыми, свежими голосами, выковывающими новые способы работы и действий. Некоторые могут быть старше, но все же могут поделиться бесценной мудростью. Часто идейные лидеры прошлого формировали образ мышления и действия многих людей, работающих в той или иной отрасли. Например, Ogilvy on Advertising был опубликован в 1985 году, но до сих пор считается обязательным к прочтению для всех, кто работает в рекламной индустрии.

И вы можете не ограничиваться книгами, а фильмами, телевидением, блогами, информационными бюллетенями.

Соберите рекомендации из разнообразных источников и составьте список для чтения и просмотра для себя.

Тогда заплатите вперед, предоставив список всем коллегам, которые вместе с вами поднимаются по кривой обучения. В конце концов, мы должны стараться постоянно сглаживать эту кривую обучения для людей, которые хотят присоединиться к нам в наших усилиях.

Каждый домен имеет свою терминологию.Между жаргоном и аббревиатурами может показаться, что вы изучаете совершенно новый язык! Каждый раз, когда я брался за новый сложный домен, будь то поиск в Google, видео на YouTube или теперь цифровая реклама в Facebook, я создавал актуальный глоссарий терминологии и сокращений.

На каждой встрече и во всех домашних заданиях по отрасли я отслеживал каждый термин, который я не знал или не понимал, и записывал все аббревиатуры, которые люди так легко использовали. Некоторые из них были отраслевыми, а некоторые из них были нашей собственной внутренней терминологией, закодированными именами и другим непрозрачным языком, из-за которого разговоры становились труднее понять, чем они должны были быть.Затем я брал свой список жаргона, садился за обед или кофе с кем-нибудь, кому доверял, и спрашивал его, что означает каждый термин.

Каждый раз я обнаруживал, что есть термины, которые даже серьезные эксперты не могут дать четкого определения или которые два разных эксперта определяют по-разному.

Это всегда заставляло меня чувствовать себя немного лучше, зная, что это было нелегко и для экспертов.

Я все документирую, а затем делюсь этим через внутреннюю вики и с новыми членами команды.Я обнаружил, что даже люди, которые побывали в космосе какое-то время, находят его полезным в качестве ресурса. Дело в том, что в этих сложных областях каждый постоянно учится.

Найдите кого-нибудь, у кого не только большой опыт в предметной области, но также есть энергия и интерес, чтобы помочь вам обучить вас быстрее, чем вы могли бы обучить сами. Это может быть ваш менеджер, но он также может быть коллегой в вашей группе или, может быть, кто-то из другой команды — инжиниринг, маркетинг продукта или продажи — который готов встретиться с вами и помочь ответить на ваши вопросы и помочь вам на начальном этапе. , самая крутая часть кривой обучения.

Если вы не знаете, к кому обратиться за подобным наставничеством, попросите своего руководителя согласовать вас с кем-то, кто может и желает помочь. А если вы менеджер или лидер, подумайте о том, чтобы сделать эту программу более формальной, чтобы стимулировать поток знаний в предметной области вокруг команды.

Когда мы сотрудничаем таким образом, все лодки поднимаются вместе с водой.

Само собой разумеется, что исследование пользователей — это самое ценное, что вы можете сделать, чтобы понять, какие проблемы / возможности необходимо решать и как лучше всего их решать.Очень важно провести предварительное генеративное исследование, чтобы понять, кто такие пользователи и что им действительно нужно. Но в новой сложной области есть много других способов усвоить опыт клиента.

Например, в Facebook мы отправляем команды в наши центры обработки вызовов, чтобы провести день с представителями службы поддержки и прослушать звонки в службу поддержки. Это отличный способ вызвать сочувствие к людям, для которых вы создаете дизайн, и уловить темы проблем, с которыми они сталкиваются.

Если в вашей организации или у клиента есть отдел продаж, сделайте своим приоритетом построение отношений с этой командой.

У них есть прямая связь с людьми, взаимодействующими с продуктом. Вы можете взять у них интервью и получить ценную информацию о том, что они слышат на местах о болевых точках и пробелах в предложениях продуктов. Вы можете предложить слежку за ними во время рекламного звонка, чтобы узнать, как рекламируется продукт и каков будет ответ. В качестве дополнительного преимущества вы можете посетить рабочую среду клиента и непосредственно понаблюдать за тем, как он работает.

По мере того, как вы получаете представление об отрасли и людях, для которых вы разрабатываете, вам необходимо перейти к пониманию реальных продуктов. Это может быть сложно, если эти продукты используются в контексте, который сильно отличается от вашей жизни и опыта работы.

Один из наиболее важных способов убедиться, что мы сосредоточены на правильных вещах, — это найти способ использовать наши собственные продукты.

В технологической индустрии это с любовью называют «собачьей пропиткой», и это очень важный способ, позволяющий нам оставаться в курсе того, насколько хорошо работают наши продукты.Что касается рекламы в Facebook, мы призываем сотрудников «освоить бизнес» и создавать рекламные кампании, чтобы помочь этому бизнесу расти, будь то небольшой местный магазин, интернет-магазин или некоммерческая организация, стремящаяся привлечь пожертвования. Выбор того, что вам небезразлично, увеличит вашу мотивацию к лучшему знакомству с продуктами.

Когда я впервые присоединился к Facebook, я использовал свои рекламные кредиты, чтобы привлечь трафик в свой блог. Я был очень доволен, когда кампании прошли хорошо, но, честно говоря, если кампания и не прошла, это действительно было не для меня.Я не полагаюсь на свой блог как на средства к существованию, поэтому срочности просто не было. Только когда я начал использовать свои рекламные кредиты для помощи некоммерческой организации моей сестры, я почувствовал всю ценность этого опыта.

Убедитесь, что при тестировании своей продукции вы находите способ сделать ее максимально реальной.

Вы не только найдете все, что хотите улучшить в продукте, но и получите бесценное сочувствие к своим клиентам.

Конечно, такое понятие «собачьего кормления» возможно не во всех компаниях и отраслях.Когда я работал в Wachovia Bank много лет назад, нам было чрезвычайно трудно по-настоящему понять опыт оптового банкинга, потому что для доступа к этим продуктам требовались крупные финансовые активы для открытия и обслуживания счета. В тех случаях, когда личное использование невозможно, вам придется полагаться на слежку и наблюдение за людьми, использующими продукты, задействуя команду продаж, если таковая существует, и делать все возможное, чтобы получить представление об опыте использования этих продуктов.

Иногда нам нужно проявить творческий подход, чтобы найти способы получить сочувствие и познание продукта в сложных областях.

Если вы получили представление о людях, для которых вы разрабатываете, и немного познакомились с продуктами и функциями, которые они используют, важно сделать шаг назад и потратить время на составление схемы всей системы. Я говорю не только о пакете продуктов вашей компании. Я говорю обо всей экосистеме отрасли, в которой вы работаете, и о том, как ваши продукты и услуги вписываются в нее. Понимание того, что движет или мешает успеху, требует от нас мыслить на системном уровне, а не только на уровне функции или потока.

Например, в рекламе мы можем думать о нашей дизайнерской задаче, как о том, чтобы в первую очередь помочь людям создавать и оценивать рекламные кампании. Речь идет о разработке наиболее эффективных и простых в использовании инструментов. Тогда мы можем предположить, что если рекламодатели имеют большой опыт работы с инструментами, они логично будут тратить больше своего рекламного бюджета на нашу платформу. Но если мы не вернемся к очень широкоугольному объективу, мы можем упустить важные силы экосистемы, которые могут помешать этому. Например, различные роли в организации, которые могут иметь несовпадающие стимулы; бизнес-модели, которые могут полагаться на сохранение статус-кво; или общая инерция, которая существует во всех сложных системах.

Инерция определяется как «свойство материи, благодаря которому она продолжает свое существующее состояние покоя или равномерного движения по прямой линии, если это состояние не изменяется под действием внешней силы».

Во многих случаях «внешняя сила», которая может изменить способ работы вещей, — это … дизайн.

Будь то в рекламе, здравоохранении, образовании или правительстве — выберите свою любимую нефункциональную, но критически важную социальную систему — то, что мы делаем, как дизайнеры, может изменить ситуацию к лучшему.

Выбираясь из-под сорняков, чтобы взглянуть на общую картину, мы гарантируем, что мы будем сосредоточены не только на получении правильных деталей, но и на решении правильных проблем и способами, которые действительно приведут к положительным изменениям с течением времени.

Границы | Изучение предметно-инвариантных представлений гистологических изображений

1. Введение

Традиционный рабочий процесс патологических лабораторий, основанный на микроскопии, претерпевает быстрые изменения с момента появления сканирования всего предметного стекла.Эта новая технология позволяет просматривать оцифрованные гистологические слайды на компьютерных мониторах и интегрировать передовые алгоритмы анализа изображений, которые могут позволить патологам выполнять более точный и объективный анализ тканей.

Процесс создания цифрового слайда состоит из нескольких последовательных процедур: фиксации формалином и заливки ткани в парафин, срезы, окрашивание и сканирование. Каждая процедура имеет множество параметров, которые со временем меняются в разных лабораториях патологии и в одной и той же лаборатории.Это приводит к значительному изменению внешнего вида тканей на цифровых слайдах, что добавляет к лежащей в основе биологической вариабельности, которая может возникать, например, из-за различий в типе ткани или патологии.

В реальном сценарии гистологические изображения становятся доступными в паре с достоверными аннотациями для разработки прогнозной модели для решения и автоматизации данной задачи. Очень часто эти изображения были получены в определенных условиях (с помощью того же сканера, после специального лабораторного процесса подготовки или, например, из небольшой группы), что приводило к более узкому диапазону появления, чем то, что можно было бы наблюдать в других условиях (другой сканер, лаборатория или когорта).

Несоответствие между ограниченным распределением данных, доступным во время обучения, и более высокой вариабельностью возможных гистологических изображений, на которых ожидается работа модели, часто ограничивает обобщение методов анализа изображений, включая методы, основанные на глубоком обучении.

Эта проблема обычно решается с помощью специальных методов , основанных на известных априорных значениях. Например, можно исправить известную изменчивость окрашивания с помощью подхода нормализации окрашивания.Однако, полагаясь на такие специально выбранные априорные значения, повышается риск пропустить или усилить доменно-специфический шум в изученном представлении. Например, методы нормализации окрашивания не учитывают другие источники изменчивости, такие как определенный тканевой плеоморфизм.

Методы глубокого обучения изучают абстрактные представления непосредственно из данных изображения и достигли самых современных результатов во многих задачах компьютерного зрения и анализа медицинских изображений, включая гистопатологию. Каждый гистологический слайд является результатом заданного набора скрытых параметров (например, соответствующего конкретному случаю, больнице или типу ткани) и, таким образом, может считаться отдельной областью.Таким образом, все фрагменты изображения, извлеченные из данного полного изображения слайда (WSI), являются образцами одного и того же распределения данных, а значит, одной и той же области. Мы предполагаем, что изучение представления, которое явно инвариантно по отношению к доменам обучающих данных, вероятно, будет в некоторой степени также инвариантным к новым невидимым доменам.

Эта гипотеза мотивирована тем фактом, что обычные сверточные нейронные сети (CNN) сохраняют в своем представлении информацию о предметной области, которая бесполезна для решения поставленной задачи.Это явление проиллюстрировано на Рисунке 1A: признаки внешнего вида, присутствующие на некоторых цифровых слайдах, образуют отдельные кластеры в пространстве заученного представления, даже если слайды имеют общий известный фактор вариабельности (участки с разных изображений ткани печени, выделенные синим цветом, распределены отдельно. при представлении базовой моделью). В примере на Рисунке 1A участки изображения, происходящие из невидимой области (ткань толстой кишки, представленная серым цветом), образуют непересекающийся кластер в области, для обработки которой модель не была обучена, и это, вероятно, приведет к плохим характеристикам.Однако это внутреннее распределение может стать более плавным, если используются стратегии, обеспечивающие инвариантность области представления. Распределение вложений, показанное на рисунке 1B, иллюстрирует, как представление видимых доменов, которые не пересекались между одним и тем же органом, теперь перекрывается, и как невидимые домены совпадают с этим плавным распределением: серый кластер, представляющий невидимый тип ткани органа, теперь связан с остальные вложения, и с большей вероятностью приведут к лучшим характеристикам обобщения.

Рисунок 1 . Иллюстрация распределения доменов внутреннего представления сверточных нейронных сетей (CNN), обученных для задачи сегментации ядер. Диаграммы разброса представляют собой встраивания t-SNE (1) случайного выбора из 64 фрагментов изображения для каждого из 12 цифровых слайдов, для которых репрезентативный фрагмент отображается слева и обрамлен соответствующими цветами. Каждый фрагмент изображения представлен объединенными средними и стандартными отклонениями его активаций после второго сверточного слоя CNN.Сравниваются две модели: (A) показывает представление, полученное с помощью базовой модели CNN, а (B) — модель, в которой используются нормированные по пятнам входные данные и состязательное обучение предметной области. Модели были обучены с помощью фрагментов изображений с этих 12 слайдов, а фрагменты изображений с двух удерживаемых слайдов (тип ткани толстой кишки) были встроены таким же образом и показаны серым цветом. Базовая модель индуцирует кластеры доменов в пространстве встраивания, тогда как модель, инвариантная к предметным областям, обеспечивает более плавное распределение доменов.

В этой статье мы предлагаем фреймворк противостояния предметной области, чтобы ограничить модели CNN изучать предметно-инвариантные представления (раздел 3.2.2) и сравнить его с нормализацией окрашивания (раздел 3.3.2), методами увеличения (разделы 3.3.1 и 3.3.3) и комбинации этих методов.

Состязательное обучение предметной области отличается от традиционных методов в том смысле, что оно не полагается на определенные жесткие априорные значения: предлагаемая структура использует информацию о предметной области, которая доступна в большинстве наборов данных гистопатологии, для достижения инвариантности предметной области, тогда как эта информация обычно остается в стороне. обычные методы.

Данная работа является продолжением сравнительного анализа, представленного на семинаре MICCAI-DLMIA 2017 г. (2). В дополнение к расширенному набору экспериментов мы также вносим новый технический вклад, который позволяет использовать пакетную нормализацию при обучении одной сети с различными распределениями входных данных, как это требуется для состязательных сетей домена.

Мы показываем эксперименты для двух разных задач: (1) обнаружение митоза с помощью тестового набора, полученного из лабораторий патологии, который не был виден во время обучения, и (2) сегментация ядер с помощью тестового набора, состоящего из типов тканей, которые были невидимы во время обучения.

2. Сопутствующие работы

Модели машинного обучения для гистопатологического анализа изображений, которые непосредственно учитывают изменчивость внешнего вида, можно разделить на две основные категории: (1) методы, основанные на предварительной обработке данных изображения и (2) методы, которые напрямую изменяют модель машинного обучения и / или процедура обучения.

К первой группе методов относятся различные методы нормализации окрашивания (3, 4). Некоторые конвейеры обработки изображений решают проблему изменчивости с помощью обширных стратегий увеличения данных, часто включающих преобразование цвета (2, 5–8).Гибридные стратегии, которые нарушают распределение окрашивания в дополнение к процедуре нормализации окрашивания, также были исследованы (9–12).

Во второй группе методов преобладают подходы к адаптации предметной области. Адаптация домена предполагает, что представление модели, полученное из исходного домена, может быть адаптировано к новому целевому домену. Решения для тонкой настройки и переноса доменов были предложены для моделей глубокого обучения (13–16) и с приложениями к цифровой патологии (17–19). Другой подход заключается в рассмотрении сверточных фильтров CNN как параметров, инвариантных к домену, тогда как изменчивость домена может быть зафиксирована с помощью параметров Batch Normalization (BN) (20, 21).Адаптация к новым доменам может быть достигнута путем точной настройки нового набора параметров BN, посвященных этим новым доменам (21).

Состязательное обучение CNN было предложено для достижения адаптации домена от исходного домена аннотированных данных к единственному целевому домену, из которого доступны немаркированные данные (22). Состязательные подходы нацелены на изучение общего представления, инвариантного к исходному и целевому доменам, через дискриминатор CNN, который используется для наказания модели за обучение специфическим для предметной области свойствам (22–26).Этот тип метода был успешно применен и адаптирован в области анализа медицинских изображений (27). Эти методы, однако, требуют, чтобы данные из целевых доменов были доступны во время обучения, что не является ограничением нашего подхода и не исследовалось в задачах, связанных с гистологическими изображениями. Наконец, мы предложили в Lafarge et al. (2) аналогичный подход, который заставляет модель изучать независимое от предметной области представление для данной обширной вариативности предметной области, присутствующей в обучающих данных, и мы исследовали ее способность работать с новыми невидимыми доменами.

3. Материалы и методы

Мы оцениваем различные подходы к достижению доменной инвариантности по двум актуальным задачам анализа гистопатологических изображений: сегментация ядер и обнаружение митоза. Автоматическая сегментация ядер — важный инструмент для многих последующих анализов гистопатологических изображений, таких как оценка ядерного плеоморфизма. Обнаружение митоза — это первый шаг к оценке активности пролиферации опухоли и, следовательно, важный биомаркер для прогнозирования рака груди и часть широко используемой системы оценки Блума-Ричардсона-Элстона (28).

В этом разделе мы сначала описываем наборы данных, используемые для двух задач анализа изображений, и указываем смещение домена, при котором будет оцениваться обобщение обученных моделей на новых доменах. Затем мы описываем базовую модель сверточной нейронной сети, платформу противодействия домену, нормализацию окрашивания и методы увеличения данных, которые будут использоваться в сравнительном анализе.

3.1. Наборы данных

Предлагаемый сравнительный анализ был проведен на двух наборах данных, которые выявили два разных типа изменчивости предметной области.Эти наборы данных соответствуют разным задачам, что позволяет изучить жизнеспособность фреймворка в различных параметрах анализа.

3.1.1. Межлабораторный набор данных по митозу

Мы использовали набор данных TUPAC16 (29), который включает 73 случая рака груди с гистологическими препаратами, окрашенными гематоксилин-эозином (H&E). Набор данных состоит из набора полевых изображений с высоким увеличением (HPF), которые были аннотированы положениями митотических фигур, полученных на основе консенсуса, по крайней мере, двух патологов.

Случаи поступили из трех различных лабораторий патологии (PL A , PL B и PL C с 23, 25 и 25 случаями соответственно) и были отсканированы двумя разными сканерами изображений целого слайда (слайды из PL B и PL C сканировались одним и тем же сканером).Мы разбиваем набор данных следующим образом:

• Тренировочный набор из восьми футляров из PL A (458 митозов).

• Набор для проверки с четырьмя другими случаями из PL A (92 митоза).

• Набор для тестирования с оставшимися 11 случаями из PL A (533 митоза), чтобы измерить внутрилабораторные характеристики обученных моделей в тех же условиях, что и при испытании AMIDA13 (30).

• Тестовый набор с использованием 50 случаев из PL B и PL C (469 митозов) для оценки эффективности межлабораторного обобщения.

3.1.2. Набор данных мультиорганных ядер

Мы использовали набор данных по нескольким органам, созданный в (4): подмножество из 30 изображений HPF, выбранных из отдельных WSI срезов ткани, окрашенных H и E, подготовленных в 18 различных больницах и предоставленных Атласом генома рака (31). Эти 30 изображений состоят из семи различных типов тканей с общедоступными аннотациями ядерных масок (4).

Чтобы находиться в условиях, аналогичных (4), мы разделили набор данных на две группы типов тканей T A = { Грудь, Печень, Почки, Простата } и T B = { Мочевой пузырь, Толстая кишка, Желудок }.Для экспериментальных целей разделим набор данных в условиях (4) следующим образом:

• Обучающий набор из 12 изображений HPF с тремя изображениями для каждого типа ткани T A (7337 ядер).

• Набор для проверки 4 других изображений HPF с одним изображением для каждого типа ткани T A (1474 ядра).

• Тестовый набор из 8 других изображений HPF с 2 изображениями для каждого типа ткани T A (4130 ядер).

• Тестовый набор с использованием 6 HPF-изображений T B с 2 изображениями каждого типа (4025 ядер) для оценки эффективности обобщения по типам тканей.

3.2. Фреймворк состязательности домена

Предлагаемая нами структура предназначена для задач классификации изображений x , связанных с метками классов y .

3.2.1. Базовая сверточная сеть

Предлагаемая структура применима к любой базовой архитектуре CNN, которая может быть разложена на две части: экстрактор признаков CNN F и классификатор CNN C, параметризованный θ F и θ C соответственно, как показано на рисунке 2.

Рисунок 2 . Блок-схема предметно-состязательной модели. Модель обучается с использованием пакетов, сбалансированных по классам или доменам. Промежуточное представление обучается для оптимизации классификатора, в то время как дискриминатор обучается определять домены происхождения из этого представления. Обратное градиентное распространение показано стрелками справа налево, противодействие обратному распространению показано извилистой стрелкой. Представление, инвариантное к предметной области, проиллюстрировано как выбор из трех карт активации, которые выводятся экстрактором признаков, и все они назначены каналам RGB.

F принимает изображения x в качестве входных данных и выводит промежуточное представление F (x; θF), тогда как C принимает F (x; θF) в качестве входных данных и выводит вероятность классификации C (F (x; θF); θC). Трубопровод (F, C) можно обучить, минимизируя потери кросс-энтропии LC (x, y; θF, θC). θ F и θ C оптимизируются с помощью стохастического градиентного спуска с использованием мини-пакетов пар изображение-метка ( x, y ).

3.2.2. Обучение состязательности домена

Цель структуры — сделать промежуточное представление F (x, θF) инвариантным по отношению к областям обучающих данных. Мы делаем предположение, что, сделав F (x, θF) независимым от предметной области, это улучшит междоменное обобщение классификатора C. Сделав представление инвариантным по отношению к известной вариативности предметной области обучающих данных, мы можем ожидать, что в в некоторой степени он также будет инвариантным к невидимым факторам изменчивости.

Для достижения этой цели мы превратили базовую CNN в доменно-состязательную нейронную сеть (DANN) (22), задействовав дискриминатор CNN D с параметрами θ D . D принимает представление F (x; θF) в качестве входных данных и предсказывает вероятность области D (F (x; θF), θD) входных обучающих изображений x посредством активации softmax. Мы определяем LD (x, d; θF, θD) как потерю кросс-энтропии дискриминатора домена при вводе пары изображение-домен ( x , d ), с d идентификатором домена, уникальным для каждый слайд набора обучающих данных.

Минимизация LD (x, d; θF, θD) во время обучения подразумевает, что специфичные для предметной области особенности извлекаются из общего представления, которое мы хотим сделать предметно-инвариантным. Такая идентификация доменов возможна, поскольку обычные модели естественным образом распределяют домены друг от друга в представлении, как показано на рисунке 1A. Чтобы получить доменную инвариантность, веса θ F совместно оптимизируются с помощью стохастического градиентного подъема, чтобы максимизировать LD (x, d; θF, θD).Этот процесс направлен на удаление из представления специфичных для предметной области функций, которые бесполезны для решения поставленной задачи, как показано на рисунке 1B, но при этом оптимизируются для повышения производительности C.

.
3.2.3. Обработка распределений входных данных, связанных с классификацией и доменом

Пакетная нормализация (BN) (32) используется во всех сетях F, C и D, поскольку это эффективный метод, обеспечивающий быстрое и стабильное обучение, в частности, с состязательными компонентами (33).Нормализуя каждый пакет с вычисленным средним значением и дисперсией на каждом сверточном слое, BN подразумевает, что распределение карт признаков является функцией распределения входного пакета. Как следствие, распределение карт функций будет варьироваться в зависимости от баланса партии, связанной с каждым проходом (см. Раздел 3.2.2).

Необходимо, чтобы обновление, зависящее от домена, вычислялось с помощью прямого прохода в тех же условиях, что и для прохода классификации. Поэтому мы предлагаем применять BN во время состязательного прохода, используя накопленные моменты F, сохраняя при этом регулярное вычисление BN и регулярное накопление момента во время прохода классификации.С этой целью мы скорректировали состязательное обновление (4), чтобы обновлять только сверточные веса ϑ F θ F , чтобы не мешать весам BN, обновленным в соответствии с к (1) сдачи классификации с той же мотивацией, что и в Karani et al. (21).

Процедура обучения состязательному домену состоит в чередовании четырех правил обновления:

Оптимизация экстрактора признаков со скоростью обучения λ C :

θF ← θF-λC∂LC∂θF (1)

Оптимизация классификатора:

θC ← θC-λC∂LC∂θC (2)

Оптимизация дискриминатора домена со скоростью обучения λ D :

θD ← θD-λD∂LD∂θD (3)

Состязательное обновление экстрактора признаков:

ϑF ← ϑF + αλD∂LD∂ϑF (4)

Правила обновления (1) и (4) работают враждебно: с (1) параметры θ F обновляются для задачи классификации (путем минимизации LC), а с (4 ), подмножество тех же параметров обновляется, чтобы предотвратить восстановление доменов происхождения из представления F (·; θF) (путем максимизации LD).Параметр α ∈ [0, 1] контролирует влияние состязательной составляющей.

3.3. Сравнение методов

Для сравнения мы решили изучить три различных хорошо зарекомендовавших себя стандартных метода, которые направлены на улучшение обобщения моделей глубокого обучения в контексте анализа гистопатологических изображений и не требуют дополнительных данных. Визуальный обзор этих методов представлен на Рисунке 3. Мы также проанализировали комбинации этих индивидуальных подходов вместе с предложенной структурой обучения состязательности предметной области.

Рисунок 3 . Иллюстрация различных типов предварительных обработок аугментаций: (A) исходных изображений, (B) RGB увеличение цвета, (C) нормализация окрашивания , (D) увеличение окрашивания .

3.3.1. Увеличение цвета

Поскольку наиболее заметным источником вариабельности гистологических изображений является появление окрашиваемого цвета, одна из альтернатив искусственного создания новых обучающих выборок состоит в случайном возмущении цветового распределения участков выбранных изображений.Ожидается, что за счет увеличения количества различных цветовых распределений в обучающем наборе модель выучит представление, которое лучше обобщает этот тип изменчивости.

Мы выполнили увеличение цвета (CA) путем преобразования контраста и сдвига интенсивности каждого цветового канала I c a c · ( I c — μ ( I c )) + μ ( I c ) + b c , где a c и

b взяты из равномерных распределений a c ~ U [0.9, 1.1] и b c ~ U [−13, +13] и где μ ( I c ) — средняя интенсивность I c .

3.3.2. Нормализация окрашивания

Противоположная стратегия — уменьшить изменчивость внешнего вида всех изображений в качестве этапа предварительной обработки перед обучением и оценкой обученной модели CNN. Для слайдов, окрашенных гематоксилином и эозином (H&E), можно использовать методы нормализации окрашивания (SN) (34, 35).

Интенсивность пикселей RBG-окрашенных гистопатологических изображений может быть смоделирована с помощью закона поглощения света Бера-Ламберта: I c = I 0 exp (- A c , * · С ). В этом выражении c = 1, 2, 3 — индекс цветового канала, A ∈ [0, + ∞] 3 × 2 — матрица коэффициентов поглощения и C ∈ [0, + ∞ ] 2 — концентрации красителя (34).Нормализацию окрашивания проводим по методике, описанной в (35). Это неконтролируемый метод, который разбивает любое изображение с оценками лежащих в его основе A и C . Изменчивость внешнего вида в наборе данных затем может быть уменьшена путем перекомпоновки всех изображений с использованием некоторых фиксированных эталонных коэффициентов поглощения A ref .

3.3.3. Окрашивание

Подход между CA и SN заключается в искусственном возмущении распределения концентраций, оцененных на этапе размешивания SN, перед применением этапа перекомпоновки с константой A ref (9–12).

Мы экспериментировали с Staining Augmentation (SNA) для сравнения, произвольно изменяя каждую расчетную карту концентрации C i линейно с C i g i i + h i , где g i и h i взяты из унифицированных распределений g i

[0.9, 1.1] и h i ~ U [-0,1, +0,1].

4. Эксперименты

Мы реализовали две модели DANN (22), одну для задачи обнаружения митоза и одну для задачи сегментации ядер. Обе проблемы решаются с помощью установки классификации на основе патчей. В случае обнаружения митоза C выводит вероятность того, что входные участки будут сосредоточены на митотических фигурах. В случае сегментации ядер C выводит 3-х классные векторы вероятности для центра фрагментов изображения: передний план ядер, край ядер или фон.

4.1. Архитектура

Для обеих задач мы выбрали простые сверточные сети, аналогичные имеющейся в соответствующей литературе (2, 4, 29, 30, 36). Мы решили исследовать модели DANN с одной бифуркацией на втором слое max-pooling, соответствующем рецептивным полям размером 12 × 12 для классификатора митоза и 16 × 16 для классификатора ядер.

Каждый сверточный слой активируется выпрямленным линейным модулем с утечкой (с коэффициентом 0,01), за исключением выходных слоев, которые активируются функцией softmax.Детали архитектуры представлены в таблицах 1, 2.

Таблица 1 . Архитектура модели обнаружения митоза.

Таблица 2 . Архитектура модели сегментации ядер.

4.2. Процедуры обучения

Мы использовали одну и ту же процедуру обучения для моделей обеих задач. Для всех экспериментальных конфигураций участки изображения были преобразованы с помощью конвейера увеличения базовой линии, состоящего из случайного поворота на 90 градусов, случайного зеркального отображения, пространственного масштабирования -10 / + 10%.Выборка немитозных фигур и фоновых классов ядер была скорректирована путем жесткого отрицательного анализа с использованием первой версии базовых моделей для отклонения легко классифицируемых участков изображения. Пакеты с балансировкой по доменам были построены с использованием участков размером 24 × 24 для модели обнаружения митоза и 28 × 28 для модели сегментации ядер, чтобы классификаторы домена выдавали предсказания 1 × 1.

Веса модели были оптимизированы с помощью стохастического градиентного спуска со скоростью обучения λ C = 0.01 и λ D = 0,001 и импульс μ = 0,9. λ C и λ D распадались с коэффициентом 0,9 каждые 5000 итераций. L 2 -регуляризация была применена ко всем сверточным весам. В целях обеспечения стабильности и, как было предложено в (27), мы использовали расписание разминки для коэффициента α, чтобы контролировать влияние состязательного компонента, следуя линейному увеличению от 0,0 до 1,0 с 5000-й до 10000-й итерации обучения.

5. Результаты

В этом разделе представлены количественные и качественные оценки способности разработанных моделей обобщать известный фактор изменчивости тестового набора, который отсутствует в обучающих данных.

5.1. Обнаружение митоза

Эффективность моделей обнаружения митоза оценивалась по шкале F1, как описано у Veta et al. (29, 30) и Cireşan et al. (36). Мы использовали обученные классификаторы для создания плотных карт вероятности митоза для всех тестовых изображений.Все локальные максимумы выше рабочей точки считались обнаруженными митотическими фигурами. Эта рабочая точка была определена как порог, который максимизирует оценку F1 по проверочному набору.

В тесте, сделанном из изображений, полученных в тех же лабораториях, что и изображения обучающего набора, все методы и комбинации показали относительно хорошие характеристики, что соответствует ранее опубликованным результатам (5, 29, 30, 36). Самый эффективный метод — СА (F1-оценка 0,62 ± 0,008, см. Рисунок 4). Добавление состязательного обучения предметной области не улучшает работу традиционных методов.

Рисунок 4 . Коробчатая диаграмма F1-оценки моделей классификации митозов. Точки представляют собой среднее значение ± стандартное отклонение F1-балла каждой модели по 3 повторам со случайной инициализацией и случайной выборкой патчей. DANN, доменно-состязательная нейронная сеть; CA, увеличение цвета; SN — нормализация окрашивания; SNA, Улучшение окрашивания.

С другой стороны, на тестовом наборе изображений, полученных в лабораториях, отличных от обучающего набора, лучшим методом является комбинация CA и DANN (F1-оценка 0.609 ± 0,017). Базовая модель не обобщается должным образом на невидимые лаборатории, а обучение предметно-состязательному обучению улучшает производительность, за исключением комбинации с SNA.

5.2. Сегментация ядер

Мы использовали обученные классификаторы ядер для создания сегментированных ядерных объектов. Сначала мы сгенерировали набор начальных значений объекта, используя предсказание карты переднего плана объекта, пороговое значение которого определяется рабочей точкой, выбранной на основе набора проверки. Набор начальных значений фона был сгенерирован с использованием прогнозирования фона с пороговым значением 0.5. Наконец, с использованием алгоритма водораздела был сгенерирован набор сегментированных ядерных объектов с учетом вычисленных исходных данных фона и переднего плана и предсказанных краев в качестве топографического рельефа.

Все сегментированные объекты с перекрытием более чем на 50% с наземными аннотациями считались попаданиями. Характеристики моделей сегментации ядер были оценены с помощью F1-score, как описано в (4), рассчитанного для всего набора тестов.

На тестовом наборе изображений видимых типов тканей наиболее эффективным методом является SN (F1-оценка 0.821 ± 0,004, см. Рисунок 5). На тестовом наборе невидимых типов тканей наиболее эффективным методом является комбинация SN и предметно-состязательного обучения (F1-оценка 0,851 ± 0,011). В обоих тестовых наборах обучение состязательности предметной области приводит к снижению производительности обобщения в сочетании с методами дополнения (CA и SNA).

Рисунок 5 . Коробчатая диаграмма F1-оценки моделей сегментации ядер. Точки представляют собой среднее значение ± стандартное отклонение F1-балла каждой модели по 3 повторам со случайной инициализацией и случайной выборкой патчей.DANN, доменно-состязательная нейронная сеть; CA, увеличение цвета; SN — нормализация окрашивания; SNA, Улучшение окрашивания.

Базовая модель обобщается правильно из-за высокой вариабельности, уже присутствующей в обучающей выборке, и, следовательно, соответствует результатам, представленным в Kumar et al. (4). Мы сообщаем о разнице в диапазоне характеристик между двумя тестовыми наборами.

5.3. Качественные результаты

Качественно мы наблюдаем, что базовые модели не могут быть обобщены с изображениями, которые имеют невидимый низкоконтрастный вид (см. Примеры Bladder и Colon на рисунке 6).Этот предел решается методами, включающими нормализацию окрашивания. Добавление состязательного обучения предметной области имеет тенденцию лучше разделять ядра касания, улучшая показатель F1.

Рисунок 6 . Визуализация необработанных прогнозов (фон: белый, передний план: черный, граница: красный) и результирующих карт сегментации базовой и наиболее эффективных моделей сегментации. Истинно положительный, ложноположительный и ложноотрицательный показаны зеленым, синим и красным цветом соответственно.

Аналогичным образом, низкоконтрастные структуры, встречающиеся на изображениях из невидимых лабораторий, влекут за собой ложноположительное обнаружение митотических фигур (см. Рисунок 7), тогда как это не происходит для моделей, обученных с использованием СА.Добавление состязательного обучения предметной области имеет тенденцию к более плавному распределению прогнозов, что приводит к более высокому уровню истинно положительных результатов и более высокому баллу F1.

Рисунок 7 . Визуализация прогнозов базовой и наиболее эффективных моделей (CA для набора тестов в видимой лаборатории и CA + DANN для набора тестов в невидимой лаборатории). Основные митотические фигуры обведены зеленым.

6. Обсуждение и выводы

Относительное улучшение характеристик, получаемое с помощью анализируемых методов, зависит от данных и поставленной задачи.В случае, когда обучающие данные представляют собой высокую вариабельность области (изображения из нескольких лабораторий, несколько типов органов), SN является наиболее эффективным методом при тестировании на тестовом наборе, состоящем из тех же типов тканей, поскольку модель может научиться эффективен для диапазона вариабельности окрашивания, наблюдаемого на этих конкретных типах тканей. Тем не менее, CA и SNA обобщают лучше, чем SN на тестовом наборе, который состоит из невидимых типов тканей, поскольку они позволяют предвидеть новую изменчивость цвета и окрашивания, которая может возникнуть на этих изображениях.Мы предполагаем, что этот предел SN преодолевается в сочетании с состязательным обучением в предметной области, поскольку он позволяет модели улучшить обобщение изученного представления за пределами диапазона распределений окрашивания, наблюдаемых в обучающей выборке.

В случае, когда обучающие данные представляют собой низкую вариабельность области (только внутрилабораторная вариабельность), СА и SNA были наиболее эффективными методами при тестировании на невидимых изображениях, были ли они получены в той же лаборатории, что и обучающие данные, или в разные лаборатории.Это означает, что в этой ситуации методы увеличения или тренировка противоборствующей области могут лучше предвидеть невидимое распределение цвета / окрашивания, чем SN. Случай отказа базовой модели указывает на переоснащение на ограниченную вариативность областей обучающих данных, и его можно избежать с помощью CA, SNA или состязательного обучения предметной области. Дополнительное улучшение производительности, показанное при сочетании обучения предметной состязательности с CA, указывает на то, что этот подход помогает модели обобщить на факторы, отличные от цветов.

Необходимо рассмотреть два варианта дизайна в предлагаемой структуре состязательности предметной области, поскольку мы предполагаем, что они влияют на выполнение задачи. Эти параметры зависят от типа изображения, выполняемой задачи и типа изменчивости предметной области, и поэтому их необходимо тщательно настраивать.

Во-первых, необходимо выбрать уровень глубины F: при ранней бифуркации низкоуровневые функции можно сделать инвариантными (с риском чрезмерного соответствия доменам обучающих данных), тогда как поздняя бифуркация может сделать высокоуровневые функции инвариантны с риском того, что ранние функции не будут затронуты обновлением, зависящим от домена, что приведет к невозможности извлечения функций в невидимых доменах.Для получения оптимальных характеристик необходима тонкая настройка этого гиперпараметра. Альтернативное решение может заключаться в использовании множественных бифуркаций, как это было предложено в Lafarge et al. (2) и Kamnitsas et al. (27).

Воспринимающее поле D на входе — еще один момент, который следует учитывать. В зависимости от поставленной задачи, воспринимающее поле D не обязательно должно быть таким же, как C, особенно если источник изменчивости домена может быть зафиксирован в поле зрения меньшем, чем классифицируемые объекты.Использование слишком большого воспринимающего поля для D повышает риск идентификации и удаления из представления некоторых характеристик, специфичных для домена, которые могут действительно иметь отношение к поставленной задаче.

В заключение, мы предложили состязательную основу для обучения моделей CNN на гистопатологических изображениях и провели сравнительный анализ с традиционными методами предварительной обработки. Мы показали, что использование информации о предметной области на уровне слайдов во время обучения посредством состязательного процесса обучения, таким образом, является подходящим дополнительным подходом к изучению предметно-инвариантного представления и для улучшения характеристик обобщения.Тем не менее, характеристики обученной модели различаются в зависимости от типа используемого метода нормализации / увеличения и типа изменчивости, присутствующей в данных во время обучения и вывода. Поэтому анализ этих факторов является важным шагом к решению при разработке моделей машинного обучения для анализа гистологических изображений. Направления для дальнейших исследований включают адаптацию структуры к другим архитектурам модели, другим задачам и использование известных факторов изменчивости, отличных от информации на уровне слайдов. Относительные высокие показатели, достигнутые при обучении соперничеству в предметной области, подтверждают, что это актуальное направление исследований в направлении общего метода последовательного обобщения любого типа невидимой изменчивости гистологических изображений.

Доступность данных

Наборы данных, использованные для этого исследования, находятся в открытом доступе. Подробнее см. Veta et al. (29) для набора данных о митозах между лабораториями, а Kumar et al. (4) для набора данных по ядрам нескольких органов.

Авторские взносы

ML и MV внесли свой вклад в концепцию и дизайн исследования. ML провел эксперименты и написал первый черновик рукописи. Все авторы внесли свой вклад в анализ результатов, доработку рукописи, прочитали и одобрили представленную версию.

Заявление о конфликте интересов

Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

Список литературы

1. Маатен Лвд, Хинтон Г. Визуализация данных с использованием t-SNE. J Mach Learn Res . (2008) 9: 2579–605. DOI: 10.1007 / s10994-011-5273-4

CrossRef Полный текст | Google Scholar

2. Lafarge MW, Pluim JP, Eppenhof KA, Moeskops P, Veta M.Домен-состязательные нейронные сети для решения проблемы изменчивости внешнего вида гистопатологических изображений. В: Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support . Квебек, Квебек: Спрингер (2017). п. 83–91.

Google Scholar

3. Чомпи Ф., Геессинк О, Бейнорди Б. Э., де Соуза Г. С., Байдошвили А., Литдженс Дж. И др. Важность нормализации окраски в классификации колоректальной ткани с помощью сверточных сетей. В: 2017 14-й Международный симпозиум IEEE по биомедицинской визуализации (ISBI 2017) .Мельбурн, Виктория: IEEE (2017). п. 160–3.

Google Scholar

4. Кумар Н., Верма Р., Шарма С., Бхаргава С., Вахадан А., Сетхи А. Набор данных и метод обобщенной ядерной сегментации для вычислительной патологии. IEEE Trans Med Imaging . (2017) 36: 1550–60. DOI: 10.1109 / TMI.2017.2677499

PubMed Аннотация | CrossRef Полный текст | Google Scholar

5. Вета М., ван Диест П.Дж., Джива М., Аль-Джанаби С., Плюм Дж.П. Подсчет митозов при раке груди: соглашение между наблюдателями на уровне объекта и сравнение с автоматическим методом. PLOS ONE . (2016) 11: e0161286. DOI: 10.1371 / journal.pone.0161286

PubMed Аннотация | CrossRef Полный текст | Google Scholar

6. Veta M, Van Diest PJ, Pluim JP. Исключение посредника: измерение ядерной площади на гистопатологических слайдах без сегментации. В: Международная конференция по медицинской обработке изображений и компьютерному вмешательству . Спрингер (2016). п. 632–9.

Google Scholar

7. Сиринукунваттана К., Раза СЭА, Цанг Ю.В., Снид Д.Р., Кри, И.А., Раджпут, штат Нью-Мексико.Глубокое обучение с учетом местоположения для обнаружения и классификации ядер на стандартных гистологических изображениях рака толстой кишки. IEEE Trans Med Imaging. (2016) 35: 1196–206. DOI: 10.1109 / TMI.2016.2525803

PubMed Аннотация | CrossRef Полный текст | Google Scholar

8. Хоу Л., Нгуен В., Каневский А.Б., Самарас Д., Курц Т.М., Чжао Т. и др. Редкий автоэнкодер для неконтролируемого обнаружения ядер и представления на гистопатологических изображениях. Патт Призн . (2019) 86: 188–200.DOI: 10.1016 / j.patcog.2018.09.007

PubMed Аннотация | CrossRef Полный текст | Google Scholar

9. Tellez D, Balkenhol M, Karssemeijer N, Litjens G, van der Laak J, Ciompi F. Увеличение окрашивания H и E улучшает обобщение сверточных сетей для гистопатологического обнаружения митоза. В: Медицинская визуализация 2018: цифровая патология. т. 10581. Международное общество оптики и фотоники . Сан-Диего, Калифорния (2018). п. 105810Z.

Google Scholar

10.Теллез Д., Балкенхол М., Отте-Хёллер И., ван де Лоо Р., Фогельс Р., Булт П. и др. Обнаружение митоза на всем слайде в гистологии молочной железы H&E с использованием PHh4 в качестве эталона для обучения дистиллированных инвариантных к пятнам сверточных сетей. IEEE Trans Med Imaging. (2018) 37: 2126–36. DOI: 10.1109 / TMI.2018.2820199

CrossRef Полный текст | Google Scholar

11. Ван Эйке Ю. Р., Балсат С., Версет Л., Дебейр О., Лосось I, Декастекер С. Сегментация железистого эпителия в колоректальных опухолях для автоматического разделения количественной оценки биомаркеров IHC: подход глубокого обучения. Med Image Anal . (2018) 49: 35–45. DOI: 10.1016 / j.media.2018.07.004

PubMed Аннотация | CrossRef Полный текст | Google Scholar

12. Рахлин А, Швец А, Игловиков В, Калинин АА. Глубокие сверточные нейронные сети для анализа изображений гистологии рака груди. В: Международная конференция по анализу и распознаванию изображений . Спрингер (2018). п. 737–44.

Google Scholar

13. Тайгман Ю., Поляк А., Вольф Л. Неконтролируемая кросс-доменная генерация изображений.arXiv: 161102200 (2016).

Google Scholar

14. Гафурян М., Мехрташ А., Капур Т., Карсемейер Н., Марчиори Э., Пестей М. и др. Трансферное обучение для адаптации предметной области в МРТ: применение в сегментации поражения головного мозга. В: Международная конференция по медицинской обработке изображений и компьютерному вмешательству . Спрингер (2017). п. 516–24.

Google Scholar

16. Мурез З., Колури С., Кригман Д., Рамамурти Р., Ким К. Преобразование изображения в изображение для адаптации предметной области.В: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition . Солт-Лейк-Сити, Юта (2018). п. 4500–9.

Google Scholar

17. Gadermayr M, Strauch M, Klinkhammer BM, Djudjaj S., Boor P, Merhof D. Адаптивная классификация доменов для компенсации изменчивости в гистопатологических полных изображениях слайдов. В: Международная конференция по анализу и распознаванию изображений . Спрингер (2016). п. 616–22.

Google Scholar

18.Гадермайр М., Аппель В., Клинкхаммер Б.М., Боор П., Мерхоф Д. Куда идти? Исследование эффективности переноса пятен для сегментации произвольно окрашенных гистологических изображений. В: Международная конференция по медицинской обработке изображений и компьютерному вмешательству . Спрингер (2018). п. 165–73.

Google Scholar

19. Хуан И, Чжэн Х, Лю Ц., Дин Х, Родэ Г.К. Классификация эпителия-стромы с помощью сверточных нейронных сетей и неконтролируемой адаптации домена в гистопатологических изображениях. IEEE J Biomed Health Informat . (2017) 21: 1625–32. DOI: 10.1109 / JBHI.2017.26

PubMed Аннотация | CrossRef Полный текст | Google Scholar

20. Билен Х., Ведальди А. Универсальные репрезентации: недостающее звено между лицами, текстом, планктонами и породами кошек. arXiv: 170107275 (2017).

Google Scholar

21. Карани Н., Чайтанья К., Баумгартнер С., Конукоглу Э. Подход на протяжении всей жизни к сегментации МРТ мозга с помощью сканеров и протоколов.В: Международная конференция по медицинской обработке изображений и компьютерному вмешательству . Гранада: Springer (2018).

Google Scholar

22. Ганин Ю., Устинова Е., Аджакан Х., Жермен П., Ларошель Х., Лавиолетт Ф. и др. Доменно-состязательное обучение нейронных сетей. J Mach Learn Res . (2016) 17: 1–35. DOI: 10.1007 / 978-3-319-58347-1_10

CrossRef Полный текст | Google Scholar

23. Сан Б., Саенко К. Глубокие кораллы: выравнивание корреляций для адаптации глубокой области.В: Европейская конференция по компьютерному зрению . Амстердам: Springer (2016). п. 443–50.

Google Scholar

24. Бусмалис К., Тригеоргис Г., Сильберман Н., Кришнан Д., Эрхан Д. Сети разделения доменов. В: Достижения в системах обработки нейронной информации . Барселона (2016). п. 343–51.

Google Scholar

25. Ценг Э., Хоффман Дж., Саенко К., Даррелл Т. Состязательная дискриминационная адаптация домена. В: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition .Гонолулу, Гавайи (2017). п. 7167–76.

Google Scholar

26. Бусмалис К., Сильберман Н., Дохан Д., Эрхан Д., Кришнан Д. Неконтролируемая адаптация области пиксельного уровня с генеративными противоборствующими сетями. В: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition . Гонолулу, Гавайи (2017). п. 3722–31.

Google Scholar

27. Камницас К., Баумгартнер С., Ледиг С., Ньюкомб В., Симпсон Дж., Кейн А. и др. Неконтролируемая адаптация домена в сегментации поражения головного мозга с состязательными сетями.В: Международная конференция по обработке информации в медицинской визуализации . Бун, Северная Каролина: Springer (2017). п. 597–609.

Google Scholar

28. Элстон К.В., Эллис И.О. Патологические прогностические факторы рака груди. I. Значение гистологической степени злокачественности при раке груди: опыт крупного исследования с долгосрочным наблюдением. CW Элстон и И.О. Эллис. Гистопатология 1991; 19; 403–410. Гистопатология. (2002) 41: 151. DOI: 10.1046 / j.1365-2559.2002.14691.х

CrossRef Полный текст | Google Scholar

29. Вета М., Хенг Ю.Дж., Статоникос Н., Бейнорди Б.Э., Бека Ф., Воллманн Т. и др. Прогнозирование пролиферации опухоли молочной железы по изображениям целого слайда: проблема TUPAC16. arXiv: 180708284 (2018).

Google Scholar

30. Вета М., Ван Дист П.Дж., Виллемс С.М., Ван Х., Мадабхуши А., Круз-Роа А. и др. Оценка алгоритмов обнаружения митоза на изображениях гистопатологии рака молочной железы. Med Image Anal .(2015) 20: 237–48. DOI: 10.1016 / j.media.2014.11.010

PubMed Аннотация | CrossRef Полный текст | Google Scholar

31. Сеть Атласа генома рака. Комплексные молекулярные портреты опухолей груди человека. Природа. (2012) 490: 61. DOI: 10.1038 / природа11412

CrossRef Полный текст | Google Scholar

32. Иоффе С., Сегеди С. Пакетная нормализация: ускорение глубокого обучения сети за счет уменьшения внутреннего ковариантного сдвига. В: Международная конференция по машинному обучению .Лилль (2015). п. 448–56.

Google Scholar

33. Рэдфорд А., Мец Л., Чинтала С. Обучение представлению без учителя с помощью глубоких сверточных порождающих состязательных сетей. arXiv: 151106434 (2015).

Google Scholar

35. Масенко М., Нитхаммер М., Маррон Дж., Борланд Д., Вусли Дж. Т., Гуан Х и др. Метод нормализации гистологических слайдов для количественного анализа. В: IEEE ISBI 2009 . (2009). п. 1107–10. DOI: 10.1109 / ISBI.2009.5193250

CrossRef Полный текст | Google Scholar

36. Чирешан Д.К., Джусти А., Гамбарделла Л.М., Шмидхубер Дж. Обнаружение митоза на гистологических изображениях рака груди с помощью глубоких нейронных сетей. В: MICCAI 2013 . Нагоя (2013). п. 411–8.

PubMed Аннотация | Google Scholar

Улучшите свои знания в предметной области с помощью этого списка курсов — Уроки бизнес-аналитика

Бизнес-аналитикам в ходе своей карьеры может потребоваться переход из одной области в другую в зависимости от проектов, на которые они назначены.Начало проекта в новой области обычно характеризуется сильным давлением, требующим понимания особенностей области, крутой кривой обучения и стремлением обеспечить ценность для бизнеса. Быстро освоить новую область не должно быть так сложно, если у человека есть доступ к нужным учебным материалам и ресурсам.

Этот пост содержит список бесплатных учебных курсов, на которые вы можете подписаться, чтобы изучить ключевые концепции конкретных доменов и повысить свою коммерческую осведомленность.«Коммерческая осведомленность» относится к общим знаниям человека о бизнесе, его опыту и, в частности, его пониманию отрасли, в которой он работает или намерен присоединиться. Хотя каждая организация имеет свои особенности, эти курсы являются отправной точкой для всех, кто хочет понять конкретные бизнес-функции, чтобы начать работу в новой среде.

Бизнес-аналитики, которые понимают, как работает бизнес, явно имеют преимущество в выделении себя и повышении ценности бизнеса.Для тех, кто хочет перейти на роль консультанта, особенно важно получить широкое представление о том, как работают предприятия.

Большинство этих курсов предлагается через МООК, такие как Coursera, edX и другие образовательные платформы. Если курс не предлагается бесплатно, предоставляется финансовая помощь. Итак, мы идем …

Цепочка поставок и логистика

Эта сфера деятельности занимается спросом и поставкой материалов, а также операциями, необходимыми для обеспечения доступности продуктов для клиентов в случае необходимости.Изучите основы эффективной логистики и управления цепочками поставок с помощью этих бесплатных курсов:

1. Основы цепочки поставок и логистики: этот курс предлагается MIT через edX и охватывает прогнозирование спроса, планирование запасов, планирование транспортировки и управление этими процессами и выполнен.

2. Управление цепочкой поставок: учебная перспектива: Предлагается Корейским передовым институтом науки и технологий. Он учит, как создавать ценность для бизнеса с помощью эффективного управления цепочкой поставок.

Управление операциями

Управление операциями, как следует из названия, занимается повседневным управлением бизнес-операциями наиболее эффективным способом. Чтобы получить знания об основах и передовых методах улучшения операций и процессов, изучите бесплатные курсы ниже:

1. Управление операциями: этот курс предлагается Университетом Иллинойса и знакомит с ключевыми концепциями, связанными с управлением операциями бизнес.Он охватывает операционную стратегию, операционные показатели, управление запасами и поставками.

Вот отрывок из курса:

Вы разовьете набор навыков, который жизненно важен для управления операциями и цепочками поставок для любого производственного или обслуживающего бизнеса, а также для оценки деятельности предприятий.

2. Введение в управление операциями: этот курс учит, как анализировать и улучшать бизнес-процессы в различных отраслях, сокращая время отклика, предоставляя клиентам больше возможностей и повышая качество.Он касается анализа процессов, производительности, оперативности и разнообразия продуктов.

Финансы

Хотите изучить финансы, язык бизнеса? Вот несколько курсов для изучения:

1. Финансы для нефинансовых людей: Этот курс предлагается Калифорнийским университетом в Ирвине и дает базовое понимание концепций финансов и бухгалтерского учета. Конкретные темы включают финансовый анализ, планирование, прогнозирование и составление бюджета, движение денежных средств и стратегическое финансирование.

2. Бизнес и его среда: обзор бизнеса и роли финансов в бизнесе:

Этот курс предлагается Консорциумом открытого образования. Вот отрывок с описанием курса:

Этот курс предоставляет терминологию и концепции функциональных областей бизнеса, закладывая основу для интерпретации и анализа правовых, социальных и этических проблем, с которыми сегодня сталкиваются предприятия. Он также исследует финансовую систему, включая различные типы финансовой отчетности.

3. Оценка активов, часть 1 предлагается Чикагским университетом. Выдержка из курса выглядит следующим образом:

Вас интересуют количественные финансы? Вы работаете в инвестиционном банке, фирме по управлению капиталом или хедж-фонде и хотите лучше разбираться в моделях? Хотите знать, что означают такие модные слова, как бета, премия за риск, цена без риска, арбитраж, премия по акциям и коэффициент дисконтирования? Этот урок для тебя.

См. Также ценообразование активов, часть 2, которая следует за ценообразованием активов, часть I.

Что такое домен и диапазон в функции? — Видео и стенограмма урока

Домен и диапазон только от значений

Значения домена и диапазона для функции

Мы начнем с простой, простой функции, подобной этой: f ( x ) = (5, -2) (3,9) (-1, 9) (4,1). У этой функции нет правила; это просто набор входных и выходных значений. Например, он говорит нам, что когда вы вводите 5, вы получаете -2, или когда вы подключаете 4, вы получаете 1.

Итак, какова область применения этой функции? Другой способ задать этот вопрос: каковы возможные входные значения? Ну их всего пара: 5, 3, 4 и -1. Вот и все! А как насчет диапазона? Это то же самое, что спросить, каковы возможные результаты. В данном случае это только -2, 9 и 1. Хотя два разных входа дают вам 9, вам не нужно указывать его дважды при записи диапазона.

Сжатие графика для поиска домена и диапазона

Мы можем немного усложнить задачу, попросив определить домен и диапазон по графику, может быть, этот.Теперь, когда мы думаем о домене (или входных данных), нам нужно искать значения x на этом графике. Есть ли где-нибудь на оси x, куда не идет этот график? Обычно я отвечаю на этот вопрос, представляя, как весь график сдавлен по оси x, может быть, вот так. Теперь возникает вопрос: какие части оси имеют сжатые части графика? Если предположить, что этот график будет продолжать всегда слева и всегда справа, похоже, что все это имеет сжатый график.Это означает, что область действия функции — это все или все действительные числа.

Чтобы найти диапазон, мы сделаем очень похожую вещь. За исключением того, что на этот раз нас интересуют выходные значения — ось Y. Это означает, что мы сжимаем график таким образом и снова смотрим, где он оказался. Однако теперь вся ось не покрыта. Он покрывается только прямо в этой области, посередине, между -1 и +1. Это означает, что диапазон — это не все действительные числа, а только значения y , содержащиеся между -1 и +1.

График с областью

Поиск домена и диапазона только по правилам

Последнее упражнение, которое мы рассмотрим, и, вероятно, самое сложное, которое мы сделаем, требует от вас определения домена и диапазона, просто глядя на правило функции . Это будет сложно, потому что я не могу научить вас методу, который позволил бы вам решать любую задачу. Вместо этого они требуют от вас хорошего концептуального понимания алгебры и функций.Но есть несколько общих правил, которые я могу вам изложить.

Общие правила: домен

Во-первых, что касается домена, есть несколько основных правил, которые вам не разрешено нарушать. Деление на ноль — одно из запретов. Итак, каждый раз, когда вы видите функцию, в знаменателе которой есть x , будет хотя бы одно значение, которое нельзя включить в домен. Например, в функции, показанной здесь: g ( x ) = 3 / ( x + 2), x = -2 даст вам ноль в знаменателе.Это делает домен этой функции любым x , кроме -2.

Еще одно запрещение — извлечение квадратного корня из отрицательных чисел, потому что этих чисел на самом деле не существует! Итак, опять же, если вы видите квадратный корень из x , вы знаете, что некоторые значения будут исключены из домена. Как вы можете видеть здесь, эта функция h ( x ) = 3, умноженная на квадратный корень из ( x — 5), будет иметь область только x s больше 5, потому что любые x меньше 5 даст вам отрицательное число внутри квадратного корня.

Последнее ограничение для домена, которое мы рассмотрим, связано с логарифмами. Хотя я мог бы начать довольно длинное и запутанное объяснение того, почему это так, вероятно, вам лучше просто поверить мне на слово, когда я скажу, что мы не можем вычислять логарифмы нуля или любого отрицательного числа. Это означает, что область определения этой функции r ( x ) = log (-2 x ) не включает никаких положительных значений x . Только когда мы подставляем отрицательное число в эту функцию, мы получаем логарифм положительного числа.

Пример функции, которая остается положительной
Общие правила: Диапазон

Теперь, думая о диапазоне, снова есть несколько типов функций, на которые следует обратить внимание. Возможно, проще всего увидеть функции, у которых x возведены в степень четного числа, например: x 2, x 4 или x 6. Графики всех этих функций выглядят примерно так, что может поможет вам увидеть, что эти функции остаются положительными, потому что даже умножение отрицательного числа на само по себе четное число раз снова превратит его в положительное.Например, (-3) 2 = +9, но затем (-3) 3 снова становится отрицательным, и вы получаете -27. Но если мы поднимемся до (-3) 4, мы снова получим +81. Следовательно, эти функции экспоненты с четными номерами будут иметь диапазоны только положительных чисел.

Но будьте осторожны. Функция f ( x ) = — x 6 будет фактически иметь диапазон всех отрицательных чисел, потому что отрицательный знак перед x 6 перевернет весь график ниже оси x, вместо этого из всех положительных значений, всех отрицательных значений в нашем диапазоне.

Это такие маленькие уловки, из-за которых довольно сложно перечислить все способы изменения диапазона всего за один урок. Но другие функции, на которые вам нужно обратить внимание, — это квадратные корни, абсолютные значения и экспоненты. Все эти функции обычно имеют диапазоны, состоящие только из положительных значений, но опять же, хитрости могут немного изменить это.

Резюме урока

Область функции — это совокупность всех возможных входов, а диапазон — это совокупность всех возможных выходов.Поиск области и диапазона на графике можно выполнить, представив, как график сжимается до оси x или оси y соответственно. Какие бы части оси ни прижимались к графику, это записи для домена или диапазона.

Найти домен и диапазон по одному правилу может быть непросто, но есть ряд общих правил, которым необходимо следовать. По сути, вам следует просто быть осторожным с любыми функциями, которые вы видите здесь, но если вы не видите ничего из этого, есть большая вероятность, что ваш ответ будет просто, все реальные числа.

Learning Domain-Independent Deep Presentations by Mutual Information Minimization

Обучение с передачей доменов направлено на изучение общих представлений данных из исходного домена и целевого домена, чтобы данные исходного домена могли помочь в классификации целевого домена. Обычное обучение переносу представлений требует, чтобы распределения представлений исходного и целевого домена были похожими, что в значительной степени зависит от характеристики распределений доменов и критериев соответствия распределения.В этой статье мы предложили новую структуру для обучения представлению передачи предметной области. Наш мотив — сделать изученные представления точек данных независимыми от доменов, к которым они принадлежат. Другими словами, из оптимального междоменного представления точки данных трудно сказать, из какого она домена. Таким образом, выученные представления могут быть обобщены на разные области. Чтобы измерить зависимость между представлениями и соответствующей областью, к которой принадлежат точки данных, мы предлагаем использовать взаимную информацию между представлениями и индикаторами принадлежности домена.Сводя к минимуму такую ​​взаимную информацию, мы изучаем представления, независимые от доменов. Мы строим классовую глубокую сверточную сетевую модель в качестве модели представления и максимизируем запас каждой точки данных соответствующего класса, который определен для внутриклассового и межклассового соседства. Чтобы узнать параметры модели, мы строим единую задачу минимизации, в которой поля максимизируются, а взаимная информация области представления минимизируется. Таким образом, мы изучаем представления, которые не только различаются, но и не зависят от доменов.Предлагается итерационный алгоритм, основанный на методе оптимизации Адама, для решения задачи минимизации для одновременного изучения параметров глубокой классовой модели и междоменных представлений. Обширные эксперименты над эталонными наборами данных показывают его эффективность и преимущество перед существующими методами обучения с передачей предметной области.

1. Введение
1.1. Предпосылки

Трансферное обучение — это проблема машинного обучения, которая имеет дело с данными из двух областей [1–6]. Одна область — это целевая область, и в этой области мы стремимся изучить эффективную модель машинного обучения для прогнозирования.Другой домен — это исходный домен, в котором у нас достаточно помеченных точек данных. Обычно в целевой области помеченных точек данных мало, чего недостаточно для изучения эффективной модели. Таким образом, обучение с переносом домена пытается передать знания из исходного домена в целевой, чтобы помочь обучению в целевом домене. Хотя целевой домен и исходный домен используют одно и то же пространство ввода и вывода, распределение точек входных данных двух доменов существенно различается.Например, в задаче категоризации текстовых тем газетная статья является исходной областью, где почти все статьи хорошо помечены, а личное коммуникационное сообщение является целевой областью. Обычно тексты сообщений не помечаются или помечаются лишь небольшая часть из них. Естественно использовать газетные статьи и соответствующие ярлыки, чтобы облегчить изучение модели для категоризации текстов сообщений. Однако газетные статьи пишутся нормально, а личные сообщения — небрежно.Таким образом, использование слов и стили письма сильно различаются. Это приводит к значительной разнице между распределениями исходного домена (газетная статья) и целевого домена (личное сообщение). Трансферное обучение направлено на построение модели прогнозирования для целевого домена с использованием точек данных обоих доменов, даже если они имеют разное распределение.

В этом случае очень необходимо сопоставить точки данных обоих доменов с общим пространством данных, чтобы они находились в одном распределении, и мы можем напрямую обучить модель для целевого домена, используя точки данных обоих доменов. ‘представления.Другое решение — сначала изучить модель для исходного домена, а затем адаптировать ее к целевому домену. В этой статье мы сосредоточимся на первом решении, в котором точки данных отображаются в общее пространство. Это решение направлено на изучение переносимых представлений домена для точек данных в разных доменах. Для обучения переносимому представлению предметной области применялись различные методы обучения представлению, включая многоядерное обучение [7–10], глубокое обучение [11–20], факторизацию неотрицательной матрицы [21–24], разреженное кодирование [25–28] и т. Д.Для обучения переносу домена на основе сопоставления распределения доменов наиболее популярный метод основан на критерии максимального среднего расхождения. Он вычисляет средние значения представлений точек данных исходного и целевого домена и минимизирует квадрат нормы расстояния, чтобы соответствовать двум доменам.

В этой статье мы исследуем проблему обучения трансферным представлениям предметной области. Однако мы не рассматриваем сопоставление распределения двух областей, а рассматриваем обучающие представления, которые можно напрямую обобщить на две области.

1.2. Связанные работы

В этом разделе мы кратко представляем современные методы обучения переносимым представлениям. Авторы [4] представляют новый метод изучения глубоких сетей для адаптации домена. Предлагаемый метод отображает выходные данные всех уровней глубоких сетей для воспроизведения гильбертовых пространств ядра и пытается сопоставить распределения выходных данных этих слоев целевого и исходного доменов. Более того, отображение пространства ядра выполняется путем применения многоядерного обучения, где оптимальная функция ядра представляет собой взвешенную линейную комбинацию нескольких ядер.Это отличается от традиционных методов обучения передачи, которые сопоставляют только распределения выходных данных последнего уровня исходного и целевого доменов. Несоответствие двух распределений измеряется критерием максимального среднего несоответствия, который фактически минимизирует квадрат евклидова расстояния между средними выходными значениями исходной и целевой областей соответствующего слоя. Авторы в [6] предложили изучить модель обучения с переносом предметной области для доменов, не зависящих от пространства признаков.В этом случае исходный домен и целевой домен имеют совершенно разное пространство функций. Точки данных исходного домена сопоставляются с точками данных целевого домена. Сопоставление гарантирует, что любая точка данных исходного домена сопоставлена ​​с точкой целевого домена с той же меткой класса. Целевой домен и исходный домен (сопоставленный с целевым доменом) представлены матрицами ядра. Чтобы измерить, насколько хорошо эти две области связаны, применяется критерий независимости Гильберта Шмидта. Он вычисляет след произведения матрицы ядра целевой области и отображенной матрицы ядра исходной области.За счет максимизации трассировки продукта цели и источника распределения исходного и целевого доменов выравниваются и сопоставляются. Авторы [1] предложили новый метод трансферного обучения. Он выбирает точки данных из исходного домена для задачи обучения целевого домена. Чтобы быть конкретным, он присваивает вес каждой точке данных исходного домена, которая играет роль выборочного веса. Этот вес выполняет две функции. Первая функция — выбрать важные точки данных исходного домена, чтобы представить исходный домен, соответствующий целевому домену.Вместо вычисления среднего вектора характеристик исходной области этот метод вычисляет взвешенное среднее значение и сопоставляет его с целевой областью по критерию максимального среднего несоответствия. Вторая функция — это взвешивание функции потерь целевых доменов. Веса точек данных целевой области и параметры классификатора также изучаются одновременно в итеративном алгоритме. Авторы [2] разработали новый многоядерный классификатор для обучения с передачей предметной области. Он создает функцию ядра путем комбинации нескольких ядер с изученными весами.Между тем, веса ядра и параметры классификатора изучаются одновременно. Чтобы соответствовать исходному домену и целевому домену, точки данных двух доменов отображаются в нелинейное гильбертово пространство, и их распределения сопоставляются в этом пространстве. Алгоритм обучения минимизирует потери классификации по помеченным точкам данных обеих областей и квадрату евклидова расстояния между средними многоядерными представлениями двух областей в соответствии с критерием максимального среднего расхождения.

1.3. Наши взносы
1.3.1. Мотив

Все вышеперечисленные методы основаны на сопоставлении двух доменных распределений представлений данных. Двумя ключевыми компонентами этого метода являются представление распределений и показатель несовпадения двух распределений. В этой статье мы отказываемся от этой структуры и предлагаем совершенно другую структуру для обучения с передачей предметной области. Мы заметили, что для идеальной модели представления в двух разных доменах по выходным данным одной точки данных мы не можем сказать, из какой области она принадлежит.В то же время мы можем отделить его от его истинного класса и других классов в соответствии с его выходными данными в модели междоменного представления. Это означает, что представление точки данных не зависит от ее домена, но тесно связано с ее классом. Таким образом, вместо измерения несоответствия распределений исходного и целевого доменов мы измеряем независимость представлений и индикаторов принадлежности к домену точек данных. Чтобы измерить зависимость между представлением и индикатором предметной области, мы используем взаимную информацию.Сводя к минимуму взаимную информацию между ними, мы изучаем независимые от предметной области представления. Между тем, мы также предлагаем максимизировать запас каждой точки данных, чтобы ее можно было отделить от точек данных из других классов и держать рядом с точками данных из тех же классов.

1.3.2. Наш метод

На основе вышеизложенных идей мы предлагаем новую модель глубокого обучения для представления точек данных задач трансферного обучения. Во-первых, чтобы улучшить способность различать точки данных разных классов, мы предлагаем изучить уникальную глубокую сверточную сеть для каждого класса, названную моделью классового сверточного представления.Это отличается от традиционных моделей представления передачи домена, которые изучают общую модель для всех классов. Чтобы сделать выходные данные этой модели независимыми от индикаторов предметной области, мы предлагаем минимизировать взаимную информацию между выходными данными модели представления и индикаторами предметной области. Оценка взаимной информации основана на вероятности представлений и условной вероятности индикаторов предметной области данных представлений. Мы разрабатываем новые оценки условной вероятности индикаторов предметной области с учетом представлений.Оценщик определяется в окрестности точки данных данного представления и вычисляет нормализованное суммирование мягких весов точек данных из входной области. Чтобы выходные данные модели были различимы, мы предложили максимизировать запас каждой точки данных в соответствующем классе. Запас определяется как разница между внутриклассовым и межклассовым различием. Внутриклассовое несходство определяется во внутриклассовой окрестности, которая содержит набор соседних точек данных из одного и того же класса, в то время как межклассовое несходство определяется в межклассовой окрестности, которая содержит набор соседних точек данных из других классов.Чтобы изучить параметры модели представления, мы создаем единую среду обучения. Целевая функция определяется путем объединения полей, взаимной информации и члена квадрата нормы для управления сложностью модели. Для решения проблемы разработан итерационный алгоритм на основе Адама.

Замечание. Общая схема предлагаемой структуры обучения для каждого класса приведена на рисунке 1. Как видно из рисунка, для каждой модели CNN ее выходы упорядочены двумя типами вспомогательной информации: индикатором предметной области и меткой класса.Наша структура вычисляет взаимную информацию между представлениями CNN и индикаторами доменов и минимизирует ее. Между тем, он рассчитывает маржу по метке класса и максимизирует ее. Таким образом, эта структура позволяет модели CNN быть разборчивой и нечувствительной к разнообразию доменов.
Наш вклад состоит из трех частей: (1) Впервые идея обучения междоменным представлениям, независимым от предметных областей, предлагается для трансферного обучения.Вместо того, чтобы изучать представления и согласовывать распределения представлений двух доменов друг с другом, мы непосредственно изучаем представления, которые не зависят от показателей их принадлежности к предметной области. Взаимная информация используется для измерения такой зависимости представлений и индикаторов предметной области, и она сводится к минимуму для поиска независимых от предметной области представлений. (2) Мы разрабатываем новый и практичный метод обучения представлению, чтобы минимизировать взаимную информацию между представлениями точек данных. и индикаторы предметной области.Взаимная информация между представлениями и индикаторами предметной области точек данных оценивается в соответствии с вероятностью представления и условной вероятностью данного представления индикатора предметной области. Мы оцениваем условную вероятность индикатора домена точки данных с учетом его представления по его окрестностям. Он рассчитывается как сумма подобия на основе нормализованного ядра Гаусса, измеренного для точек данных в окрестности, но из рассматриваемой области.(3) Мы предлагаем новую структуру трансферного обучения для моделей глубокого представления переноса предметной области. Это классовая модель, и мы изучаем параметры, одновременно максимизируя запас каждой точки данных этого класса и минимизируя взаимную информацию между представлениями точек данных и их индикаторами предметной области. Итерационный алгоритм разработан для изучения оптимальных представлений и параметров модели для вывода этих представлений.


1.4. Организация статьи

Статья организована следующим образом: в разделе 2 мы подробно представляем предлагаемый метод, включая его математическое моделирование, оптимизацию задач и разработку итеративного алгоритма. В разделе 3 мы оцениваем предложенный метод на нескольких наборах контрольных данных трансферного обучения, чтобы сравнить его с современными методами трансферного обучения. В разделе 4 мы даем заключение этой статьи и некоторых будущих работ.

2. Методы
2.1. Определение символов

В этом разделе мы даем список подробных определений символов, используемых в следующих разделах.

2.2. Моделирование проблемы

Мы предполагаем, что у нас есть набор из n обучающих точек данных, обозначенных как, где — i -я точка данных, которая состоит из экземпляров, и является j -м экземпляром . i -я точка данных. Для задачи компьютерного зрения точка данных — это изображение, а экземпляр — это фрагмент изображения, в то время как для задачи обработки естественного языка точка данных — это предложение, а экземпляр — это вектор внедрения слова.

2.2.1. Сверточные представления с большим запасом для конкретных классов

Мы рассматриваем задачу классификации классов L , обучающий набор можно разделить на подмножества классов L и набор немаркированных точек данных, метки классов которых еще не известны. Обучающий набор можно обозначить следующим образом: где — подмножество -1 -го класса, а — подмножество немаркированных точек данных.

Для класса l мы изучаем специфичную для класса глубокую модель CNN для представления точки данных X , которая выводит вектор размером м в качестве зависящего от класса сверточного вектора и представляет параметры модели.

Замечание. Мы выбрали изучение сверточных представлений по следующим двум причинам: (1) модель CNN хороша для извлечения локальных шаблонов за счет использования большого количества скользящих локальных фильтров, в то время как в большинстве приложений передачи доменов, обсуждаемых в этой статье, локальные шаблоны играть самую важную роль. Например, в задаче междоменной категоризации изображений для двух изображений из разных доменов, но содержащих один и тот же объект, модель CNN может захватывать локальную область объекта с помощью некоторых локальных фильтров, игнорируя контексты, которые могут различаться в разных доменах.Другой пример — задачи, связанные с текстом; длинные предложения одной и той же темы могут иметь разные лингвистические стили для разных областей, но все же содержать короткие фразы, которые могут быть эффективно захвачены моделью CNN с помощью ее скользящих локальных фильтров для извлечения функций из коротких фраз. (2) Модель CNN по сравнению с другие модели глубокого обучения, такие как рекуррентная нейронная сеть (RNN), имеют более эффективный процесс обучения. Модель CNN имеет параллельную структуру, и отклики скользящего фильтра вычисляются независимо друг от друга; таким образом, его вычисления могут быть легко распараллелены с помощью графического процессора.Это отличается от модели RNN, которая имеет последовательную структуру, где отклик узла вычисляется на основе отклика предыдущих узлов, что увеличивает время его вычислений по сравнению с моделью CNN. представления могут разделять точки данных -1 -го класса и других классов, насколько это возможно, так что производительность классификации может быть улучшена. С этой целью мы предлагаем научиться различать сверточные представления для точек данных -1 -го класса, максимизируя локальный запас каждой точки данных в этом классе.Для локальной границы точки данных в классе -1 определяется ее внутриклассовое соседство и межклассовое соседство. Внутриклассовое окружение — это набор из κ ближайших соседних точек данных в том же классе: где стандартное расстояние между их сверточными представлениями, зависящими от класса l , используется для измерения расстояния до соседей. Между тем, межклассовое соседство — это набор из κ ближайших соседних точек данных из другого класса: обратите внимание, что для поиска межклассовых соседей мы используем сверточные представления его класса, -1 -го класса, даже для точки данных других классов.Далее мы вычисляем меру сродства для и точку данных на основе их сверточных представлений для конкретных классов и функции ядра Гаусса: где.
Точно так же мы также вычисляем межклассовое сходство между точками данных и в: Локальный запас определяется как разница между взвешенным внутриклассовым сверточным несходством и межклассовым несходством: мы предложили максимизировать локальный запас, чтобы улучшить способность разделять точки данных. л -й класс из остальных классов.С этой целью мы минимизируем следующую целевую функцию полей по точкам данных l -го класса, чтобы узнать параметры сети сверточного представления:

2.2.2. Минимальная взаимная адаптация информационной области

Поскольку мы рассматриваем проблему обучения с переносом домена, точки обучающих данных взяты из исходного домена и целевого домена, и мы обозначаем обучающий набор исходной области как и; таким образом, . Мы вводим индикатор домена для каждой точки данных, чтобы показать, из какого она домена, где указывает, что это точка данных исходного домена, а указывает, что это точка данных целевого домена.Естественно, мы надеемся, что классовые сверточные представления исходного и целевого доменов отображаются в общее пространство одного и того же распределения. С этой целью мы требуем, чтобы представления точек данных и их индикаторы предметной области не зависели друг от друга, так что по представлению мы не можем измерить, из какой области они принадлежат. Для измерения взаимозависимости между классовым представлением z и индикатором домена π мы предложили использовать взаимную информацию между ними,.

Замечание. Согласно теории вероятностей и теории информации, взаимная информация между двумя переменными является мерой взаимной зависимости между ними. Для двух переменных, x и y , определение взаимной информации x и y вычисляется двойным интегралом следующим образом: где — совместная функция вероятности x и y и — функция вероятности x ( y ).Для дискретных переменных взаимная информация вычисляется двойной суммой: в соответствии с отношением взаимной информации к расхождению Кульбака-Лейблера, где — расхождение Кульбака-Лейблера между и и — условная вероятность x при y . Следуя уравнению (11), взаимная информация между π и z определяется следующим образом: Чтобы оценить взаимную информацию по обучающей выборке, мы предлагаем пересчитать следующим образом: Далее мы обсудим, как оценить условную вероятность индикатора предметной области, заданного сверточным представлением, и вероятность сверточного представления,.

2.2.3. Оценка

Чтобы оценить вероятность π для данной точки данных, мы предлагаем вычислить плотность π по окрестности. — это набор из k ближайших соседей, а вероятность превышения π рассчитывается как эмпирическое распределение, где, если x истинно, в противном случае 0. Согласно уравнению (15), это взвешенное суммирование сверх , а веса — твердые. Мы выпускаем расчет весов как мягкий вес в соответствии с распределением Гиббса следующим образом:

Веса удовлетворяют ограничениям и.

2.2.4. Оценка

Мы предполагаем, что сверточные представления распределены равномерно; Таким образом, мы используем простую эмпирическую функцию распределения для вычисления вероятности следующего вида:

Подставляя уравнения (17) и (15) в (13), мы перепишем взаимную информацию между переменными z и π следующим образом:

Чтобы упростить уравнения, мы вводим следующие переменные: так, чтобы

Мы перепишем уравнение (18) с, и следующим образом:

Чтобы изучить междоменное представление для отображения данных обоих доменов в общее пространство, мы максимально уменьшаем зависимость индикатора предметной области и переменных сверточного представления.Поскольку взаимная информация измеряет зависимость, мы минимизируем следующее:

Таким образом, мы надеемся, что изученные представления будут максимально независимы от доменов, чтобы их можно было обобщить для адаптации к обоим доменам.

Чтобы построить структуру обучения для задачи адаптации предметной области на основе классовой модели глубокого представления CNN, мы объединяем объекты уравнений (8) и (22) для задачи минимизации: где термин используется для управления сложностью модели чтобы предотвратить проблему переобучения, и являются параметрами компромисса.В цели первый член представляет собой соответствующий член с большим запасом, в то время как второй и третий члены соответствуют энтропиям распределения местоположений сверточных представлений по соседству, заданному исходным и целевым доменами. Четвертый из них соответствует энтропии общего расположения представлений.

2.3. Оптимизация

Трудно решить проблему уравнения (23), потому что классовые представления являются выходами глубокой функции CNN, а также определяют окрестности и сродства.Чтобы решить проблему уравнения (23), мы рассматриваем представление как переменные запаса и вводим следующую задачу оптимизации:

Для решения этой проблемы мы используем алгоритм ADMM. Следуя ADMM, мы имеем следующую задачу оптимизации: где — двойная переменная для ограничения, а ρ — ее штрафной параметр. Мы решаем эту проблему, поочередно обновляя переменные в итеративном алгоритме.

2.3.1. Обновление

Обновление проводится путем решения следующей задачи ионизации: и мы решаем ее методом градиентного спуска: где ρ — параметр шага спуска, а — градиентная функция относительно,

2.3.2. Обновление

Обновление проводится путем решения следующей задачи минимизации:

Для решения этой проблемы мы также используем алгоритм обратного перехода, основанный на цепном правиле:

2.3.3. Обновление

Двойная переменная обновляется градиентным подъемом:

2.4. Общий алгоритм обучения MMITR

В этом разделе мы даем общий алгоритм итеративного обучения предлагаемого метода минимального представления взаимной передачи информации (MMITR).В этом алгоритме используется стратегия обновления, аналогичная алгоритму максимизации ожидания (EM). На каждой итерации мы сначала фиксируем представления переноса домена для обновления показателей межклассовой и внутриклассовой сродства на этапе E, а затем фиксируем показатели сродства между классами и внутри классов для обновления параметров CNN и представлений на M-этапе. Итерации останавливаются до тех пор, пока не будет достигнуто максимальное количество итераций или пока целевое значение не достигнет порогового значения. Общий алгоритм описан в алгоритме 1.

Вход : обучающий набор классов L и немаркированных точек данных;
Ввод : индикаторы областей тренировочных точек;
Ввод : параметры компромисса и;
Ввод : максимальное количество итераций, η ;
Ввод : порог объективного значения, ε.
Инициализировать индикатор итерации.
Инициализировать параметры модели и объективное значение.
в то время как или объективное значение до
E-step : обновите межклассовое и внутриклассовое сродство для каждой точки данных в соответствии с уравнениями (5) и (6).
M-step : Итерация шагов обновления ADMM.
для до
Обновите представления переноса домена, повторяя шаги градиентного спуска уравнения (27).
Обновите параметры модели CNN, повторяя шаги обратного перехода уравнения (30).
Обновите двойные переменные, повторяя шаги градиентного подъема уравнения (31).
конец для
.
конец а
Выход : W и.
2.5. Прогнозирование новой точки данных

Когда у нас есть новая точка данных, X , для ее классификации, мы вычисляем ее классовое представление и соответствующий запас по каждому классу: где внутри- и межклассовое соседство и близость рассчитываются в соответствии с классовые представления.Новая точка данных присваивается классу, который дает максимальный запас:

3. Эксперименты
3.1. Наборы данных

В наших экспериментах мы используем следующие наборы данных в качестве эталонных наборов данных: Office-31: этот набор данных содержит 4652 изображения 31 класса. Изображения взяты из трех разных доменов: Amazon (изображения, загруженные с http://www.amazon.com), Webcam (фотографии, сделанные веб-камерой) и DSLR (фотографии, сделанные цифровой камерой SLR). ImageCLEF-DA: этот набор данных состоит из изображений 12 классов четырех доменов.Каждый домен представляет собой уникальную базу данных, включая Caltech-256, ImageNet ILSVRC 2012, Pascal VOC 2012 и Bing. Спам по электронной почте: этот набор данных содержит тексты электронной почты, содержащие спам и не спам. Данные собираются от трех пользователей, и у каждого пользователя 2500 электронных писем. Каждый пользователь рассматривается как домен. Extended Cohn-Kanade (CK +): этот набор данных представляет собой набор изображений для распознавания выражения лица. В нем есть изображения 123 предметов, и каждый предмет рассматривается как область. В этом наборе данных всего 593 видео, и для каждого видео есть около 20 кадров.Каждое изображение лица принадлежит к одному из 7 классов выражения. Amazon: этот набор данных представляет собой набор данных задачи классификации текста. Тексты взяты из трех разных доменов, и каждый домен представляет собой обзор книг, DVD и музыки. Для каждого домена есть 2000 текстов положительных отзывов и 2000 текстов отрицательных отзывов.

3.2. Экспериментальная установка

В этом эксперименте мы используем каждый домен набора данных в качестве целевого домена по очереди, а остальные домены как исходные.Для каждого тестового домена мы используем протокол исключения одного, чтобы разделить его на обучающий набор и тестовый набор. Каждая точка данных целевого домена по очереди используется как точка данных теста, а оставшиеся точки данных объединяются для формирования обучающего набора. Обучающий набор целевого домена случайным образом разделяется на немаркированный набор и помеченный набор с равным размером. Точки данных исходных доменов всегда обрабатываются как помеченные в наших настройках. Наш алгоритм выполняется на обучающей выборке для изучения параметров модели классового представления и независимых от предметной области представлений, а затем используется для классификации точек тестовых данных.Точность классификации используется для оценки производительности алгоритма.

3.3. Результаты

В нашем эксперименте мы сначала экспериментально изучаем свойства алгоритма, включая его чувствительность к параметрам компромисса и его свойство сходимости к номерам итераций. Затем мы сравниваем его производительность с современными алгоритмами обучения переносу предметной области.

3.3.1. Оценка свойств алгоритма

(1) Чувствительность к компромиссным параметрам .В нашем алгоритме есть два компромиссных параметра: и. Они являются весами члена взаимной информации и члена сокращения сложности в нашем объекте. Мы строим график точности нашего алгоритма для различных значений, как показано на рисунке 2. Из этого рисунка мы видим, что точность улучшается в большинстве случаев, когда значение увеличивается. Поскольку это вес термина взаимной информации для измерения степени зависимости представления от домена, это указывает на то, что более независимое от домена представление помогает классификации в целевом домене.Фактически, чем более независимым является представление от домена, тем лучше объединяются данные разных доменов. Таким образом, исходный домен может больше помочь проблеме обучения в целевом домене. Этот феномен еще более очевиден в наборе данных CK +; при увеличении от 1 до 10 точность значительно повышается. Это убедительное свидетельство того, как минимум взаимной информации улучшает трансферное обучение.

Кривые точности классификации с разными значениями показаны на рисунке 3.Из этого рисунка видно, что предложенный алгоритм устойчив к изменению. Поскольку алгоритм не чувствителен к изменению, настройка этого параметра будет простой для конкретного набора данных. Единственное исключение — это случай, когда изменяется от 1 до 10, точность резко меняется.

(2) Анализ сходимости . Поскольку наш алгоритм является итеративным, очень важно знать, когда остановить итерации. Мы изучаем сходимость алгоритма, построив график точности для разных наборов данных с различным количеством итераций на рисунке 4.Согласно кривым на рисунке, в большинстве наборов данных алгоритм дает лучшую точность, когда число итераций растет, а затем становится стабильным после примерно 100 итераций. Для набора данных о спаме по электронной почте алгоритм сходится за 50 итераций.

Замечание. Для решения задачи минимизации в нашем алгоритме мы использовали алгоритм ADMM. Чтобы убедиться, что алгоритм ADMM эффективно решает оптимизацию задачи минимизации, мы наносим на график значения объектов задачи обучения с увеличением числа итераций на рисунке 5.Как видно из кривых, значение объекта стабильно уменьшается по мере увеличения количества итераций, пока не достигнет сходимости, а затем изменение значений объекта становится небольшим. Это убедительное свидетельство того, что алгоритм ADMM эффективно решает задачи оптимизации (таблица 1).

9102 93
93
93
93 набор данных th class

Символ Определение

i -эта точка данных
Набор немаркированных точек данных
z Представление точки данных с передачей домена
Параметры модели CNN класса l

Внутриклассовое окружение i -й точки данных
Межклассовое окружение i -й точки данных
Внутриклассовое сродство между i

60 и i

60 -ые точки данных

Межклассовая близость между i 9 0260 -я и -я точки данных
Индикатор домена i -й точки данных
Мягкий вес j -й точки данных в i -й Район

3.3.2. Сравнение с State of the Arts

Мы сравниваем наш алгоритм MMITR с несколькими современными алгоритмами обучения передачи, включая Deep Adaptation Network (DAN) [4], Selective Transfer Machine (STM) [1], Полууправляемая адаптация домена согласования ядра (SSKMDA) [6] и обучение нескольких ядер с передачей домена (DTMKL) [2]. В таблице 2 мы предоставили подробный список алгоритмов, сравниваемых в эксперименте, в отношении аспекта компонентов представления данных и критериев соответствия предметной области.

0 Максимальное среднее несоответствие (MMD)

Метод Представление данных Критерий соответствия доменов

MMITR
STM Соответствие среднего значения ядра (KMM)
SSKMDA Многоядерное обучение Критерий независимости Гильберта Шмидта (HSIC
MMD

Сравнение результатов точности приведено на рисунке 6.На этом рисунке видно, что предлагаемый метод превосходит другие методы в четырех экспериментах из пяти. В экспериментах с тремя наборами данных (Office-31, ImageCLEF-DA и Amazon) наш алгоритм выводит второй лучший метод, DAN, с большим отрывом. Для набора данных CK + DAN немного превосходит наш метод. И DAN, и наш метод MMITR основаны на модели глубокого обучения, но наш метод пытается изучить независимые от предметной области глубокие представления, в то время как DAN пытается изучить модель глубокого обучения для представления точек данных таким образом, чтобы среднее значение представлений исходного домена и целевого домена могут быть похожи друг на друга.Согласно результатам, MMITR в большинстве случаев превосходит DAN; мы заключаем, что независимое от предметной области глубокое представление больше подходит для обучения с переносом предметной области, чем сопоставленное представление среднего предметного диапазона. Другие методы также основаны на сопоставлении средних значений представлений переноса домена, но с использованием мелкой модели вместо глубокой модели; таким образом, они не могут исследовать глубокие иерархические особенности. Это еще раз подтверждает эффективность глубинной модели.

Замечание. Условия методов результатов, представленных в 6, подробно описаны ниже.Для алгоритма DAN он имеет два гиперпараметра: MMD Penalty λ и Entropy Penalty γ , и мы устанавливаем их значения на 1 и 0,1 соответственно. Для алгоритма STM существует два гиперпараметра: C для компромисса между максимальной маржой и потерей обучения и λ для компромисса между эмпирическим риском SVM и потерей несоответствия домена. В этом эксперименте мы установили оба их значения на 1. Для алгоритма SSKMDA он имеет пять компромиссных параметров между компонентами модели:, и их значение, установленное в нашем эксперименте, составляет 10, 2, 0.1, 0,1 и 1 соответственно. Алгоритм DTMKL имеет только один гиперпараметр: параметр регуляризации C , и в экспериментах мы установили его равным 0,5. Для нашего алгоритма MMITR он имеет два компромиссных параметра: и; для каждого набора контрольных данных мы сообщаем о лучших результатах среди результатов, полученных с использованием различных значений и.

4. Выводы и будущие работы

В этой статье мы предложили новую структуру для трансферного обучения. В отличие от традиционного трансферного обучения, которое пытается сопоставить представления исходного домена и целевого домена, мы предложили изучить независимые от домена представления.Мы стремимся измерить зависимость изученных глубоких представлений и предметной области с помощью взаимной информации и изучить независимые от предметной области глубокие представления, минимизируя взаимную информацию. Мы также предложили практический метод оценки взаимной информации между предметными и глубокими представлениями. Работа нейронной сети с глубоким классовым представлением обучается в рамках этой структуры и используется для классификации новых точек данных. Эксперименты над эталонными наборами данных для трансферного обучения подтверждают эффективность предложенного метода.

Замечание. Новая концепция, предложенная в этой статье, представляет собой новую структуру обучения передачи доменов, которая минимизирует взаимную информацию между представлениями передачи доменов и индикаторами доменов, чтобы можно было эффективно использовать пробелы между доменами и изучить общее пространство представления. Новый метод, разработанный здесь, представляет собой новый алгоритм итеративного обучения для изучения представлений передачи домена на основе моделей CNN.

Доступность данных

Все наборы данных, используемые в этом документе, находятся в открытом доступе.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Три (3) области обучения — познавательная; Аффективный; И психомоторные (шапки) — применение в обучении и обучении

Разработка и проведение уроков учителями являются неотъемлемой частью учебного процесса. Следовательно, для учителей важно обеспечить достижение трех (3) областей обучения, которые включают когнитивную (мышление), аффективную (эмоции или чувства) и психомоторную (физическую или кинестетическую).Крайне важно понимать, что существуют разные категории учащихся, у которых разные потребности, и поэтому при планировании и проведении уроков необходимо применять разные методы, чтобы гарантировать удовлетворение таких потребностей. Мир образования постепенно принял стратегию « Каждый ребенок имеет значение », структура которой требует, чтобы учитывались все учащиеся с разными потребностями.

Эта статья направлена ​​на оценку трех областей обучения (когнитивного, аффективного и психомоторного) и их преимуществ для решения различных стилей обучения учащихся.

ОБЛАСТИ ОБУЧЕНИЯ

Первоначально разработанные между 1956 и 1972 годами, области обучения получили значительный вклад со стороны исследователей и экспертов в области образования. Исследования Бенджамина Блума (когнитивная область), Дэвида Кратвола (аффективная область) и Аниты Хэрроу (психомоторная область) были включены в три области обучения (Sousa, 2016).

Целостный урок, разработанный учителем, требует включения всех трех областей при построении учебных задач для учащихся.Разнообразие таких учебных задач помогает создать сравнительно всесторонний опыт обучения, который соответствует ряду стилей обучения и методов обучения. Повышенный уровень разнообразия в проведении уроков помогает вовлекать учащихся, а также создавать больше нейронных сетей и путей, которые помогают запоминать информацию и события.

Обучение помогает развить индивидуальное отношение, а также поощряет приобретение новых навыков. Когнитивная область направлена ​​на развитие умственных способностей и приобретение знаний человеком.Когнитивная область включает шесть категорий, включая знания; понимание; заявление; анализ; синтез; и оценка. Знание включает способность учащегося вспоминать данные или информацию. За этим следует понимание, которое оценивает способность учащегося понимать значение того, что известно. Это тот случай, когда студент может объяснить существующую теорию своими словами (Anderson et al, 2011). Затем следует приложение, которое показывает способность ученика использовать абстрактные знания в новой ситуации.Типичный случай — это когда студент-экономист может применить теорию спроса и предложения к изменяющейся рыночной тенденции одежды в течение определенного сезона. Категория анализа направлена ​​на различение фактов и мнений. Категория синтеза показывает способность интегрировать различные элементы или концепции, чтобы сформировать звуковой паттерн или структуру, помогающую установить новое значение. Категория оценки показывает способность выносить суждения о важности концепций.Типичный сценарий — это когда менеджер может определить и внедрить наиболее рентабельные методы производства с целью увеличения прибыли при сохранении высокого уровня конкурентного преимущества.

Аффективная область включает чувства, эмоции и отношения человека. Категории аффективной области включают явления приема; реагирование на явления; оценка; организация; и характеристика (Андерсон и др., 2011). Поддомен восприятия феноменов создает осознание чувств и эмоций, а также способность использовать выбранное внимание.Это может включать в себя внимательное прослушивание уроков в классе. Следующая поддомена реагирования на явления включает активное участие учащегося в классе или во время группового обсуждения (Cannon and Feinstein, 2005). Оценка включает в себя способность видеть ценность чего-либо и выражать это. Это включает в себя способность учащегося поделиться своими взглядами и идеями по различным вопросам, поднятым в классе. Способность учащегося отдавать предпочтение одной ценности над другой и создавать уникальную систему ценностей называется организацией.Это можно оценить по необходимости ценить академическую работу по сравнению с их социальными отношениями. Поддомен характеристики объясняет способность усваивать ценности и позволять им управлять поведением человека. В связи с этим студент считает академическую работу очень важной, поскольку она играет важную роль в принятии решения о выбранном пути карьеры, а не о том, что может быть доступно.

Психомоторная область включает использование моторных навыков и способность их координировать.Поддомены психомотора включают восприятие; установленный; управляемый ответ; механизм; сложный открытый ответ; приспособление; и происхождение. Восприятие включает в себя способность применять сенсорную информацию к двигательной активности. Например, студент выполняет серию упражнений из учебника с целью получить более высокие оценки на экзаменах. Сет, как поддомен, предполагает готовность решать ряд проблем, чтобы их преодолеть. Что касается управляемой реакции, она включает в себя способность имитировать отображаемое поведение или использовать метод проб и ошибок для разрешения ситуации (Sousa, 2016).Поддомен «Механизм» включает способность с умением и уверенностью преобразовывать выученные реакции в привычные действия. Студенты могут решать вопросы экзамена после того, как они уверенно ответят на некоторые прошлые вопросы. Сложные явные ответы объясняют способность умело выполнять сложные шаблоны действий. Типичный пример связан со способностью ученика увеличить скорость набора текста при использовании компьютера. Адаптивность — неотъемлемая часть предметной области, которая демонстрирует способность изменять приобретенные навыки в соответствии с особыми событиями.Например, студент, изучивший различные основные теории, может изобрести или создать рабочую модель, используя повседневные материалы. Происхождение также включает создание новых моделей движения для конкретной ситуации (Sincero, 2011).

ЗАКЛЮЧЕНИЕ

Обучение — неотъемлемая часть жизни каждого человека. Это очень ключ к росту и развитию и, следовательно, требует, чтобы как ученики, так и учителя были привержены процессу. Кроме того, необходимо обеспечить, чтобы обучение сочетало в целом различные аспекты, которые были определены как области обучения.

В связи с постоянно возрастающей необходимостью обеспечить обучение учащихся с использованием различных стратегий и методов, для учителей важно принять стратегию обучения, которая сочетает в себе различные области обучения, чтобы преподавание и обучение считались эффективными.

В Лондонской школе управления образованием (LSME) мы с гордостью сообщаем нашим дорогим студентам и заинтересованным сторонам, что мы активно следим за тем, чтобы все наши фасилитаторы применяли лучшие и подходящие методы обучения, которые положительно повлияли бы на когнитивную, аффективную и психомоторную области студенты.

Все наши преподаватели хорошо обучены и имеют педагогический опыт, и они преуспевают, основываясь на обратной связи с результатами, полученными вашими студентами на всех внешних экзаменах и стандартизации. Все наши выпускники имеют оплачиваемую работу в Великобритании, США, Канаде, ОАЭ, Индии, Пакистане, Саудовской Аравии, Катаре, Бахрейне, Германии, Испании и большинстве стран ЕС. Мы гордимся нашим завидным послужным списком в предоставлении наилучшего обучения нашим студентам, нашим партнерам!

Процесс обучения должен выходить за рамки чтения и запоминания фактов и информации, а также способности критически оценивать информацию, объяснять другим, а также разрабатывать вещи для повседневного использования… и это то, что мы делаем лучше всего в LSME.

ССЫЛКИ

  • Андерсон, Л.В., Кратвол, Д.Р., Айрасиан, П.У., Крукшенк, К.А., Майер, Р.Э., Пинтрих, П. (2001). Таксономия для обучения, преподавания и оценки: пересмотр таксономии образовательных целей Блума.