41 интервью по основным вопросам машинного обучения

  1. Вопросы интервью машинного обучения: алгоритмы / теория
  2. Вопросы по машинному обучению: программирование
  3. Интервью по машинному обучению: компания / отрасль
  4. Вопросы по машинному обучению: Общий интерес к машинному обучению

Вопросы интервью с машинным обучением являются неотъемлемой частью интервью по науке о данных и путем становления ученый данных , инженер машинного обучения или инженер данных. Трамплин создал бесплатное руководство по интервью данных науки поэтому мы точно знаем, как они могут сбить с толку кандидатов! Чтобы помочь решить эту проблему, мы подготовили список ключевых вопросов, которые вы можете увидеть в интервью по машинному обучению. Есть несколько ответов, чтобы согласиться с ними, чтобы вы не попали в тупик. Вы сможете добиться успеха на любом собеседовании (даже для стажировка машинного обучения с после прочтения этой части.

Мы традиционно видели, как вопросы интервью по машинному обучению появлялись в нескольких категориях. Первый действительно связан с алгоритмами и теорией машинного обучения. Вам нужно показать понимание того, как алгоритмы сравниваются друг с другом и как правильно измерить их эффективность и точность. Вторая категория связана с вашими навыками программирования и вашей способностью выполнять на основе этих алгоритмов и теории. Третий связан с вашим общим интересом к машинному обучению: вас спросят о том, что происходит в отрасли и как вы следите за последними тенденциями в области машинного обучения. Наконец, существуют вопросы, характерные для компании или отрасли, которые проверяют вашу способность усвоить общие знания в области машинного обучения и превратить их в практические пункты для продвижения практического результата.

Мы разделили это руководство по вопросам собеседования по машинному обучению на категории, которые мы упомянули выше, чтобы вам было проще получать необходимую информацию, когда речь идет об вопросах собеседования при машинном обучении.

Вопросы интервью машинного обучения: алгоритмы / теория

Эти вопросы об алгоритмах проверят ваше понимание теории машинного обучения.

Q1- Каков компромисс между смещением и дисперсией?

Больше чтения: Bias-Variance Tradeoff (Википедия)

Смещение - ошибка из-за ошибочных или чрезмерно упрощенных предположений в алгоритме обучения, который вы используете. Это может привести к тому, что модель не будет соответствовать вашим данным, что затруднит ее высокую точность прогнозирования и позволит обобщить ваши знания из учебного набора в тестовый набор.

Дисперсия - это ошибка из-за слишком большой сложности используемого вами алгоритма обучения. Это приводит к тому, что алгоритм очень чувствителен к высоким степеням вариации ваших тренировочных данных, что может привести к тому, что ваша модель будет соответствовать данным. Вы будете нести слишком много шума из ваших тренировочных данных для вашей модели, чтобы быть очень полезными для ваших тестовых данных.

Разложение смещения дисперсии по существу разлагает ошибку обучения из любого алгоритма, добавляя смещение, дисперсию и немного неснижаемой ошибки из-за шума в базовом наборе данных. По сути, если вы сделаете модель более сложной и добавите больше переменных, вы потеряете смещение, но получите некоторую дисперсию - чтобы получить оптимально уменьшенное количество ошибок, вам придется компенсировать смещение и дисперсию. Вы не хотите ни высокого смещения, ни большой дисперсии в вашей модели.

Q2- В чем разница между контролируемым и неконтролируемым машинным обучением?

Больше чтения: В чем разница между контролируемым и неконтролируемым машинным обучением? (Quora)

Контролируемое обучение требует обучения помеченных данных. Например, чтобы выполнить классификацию (контролируемое учебное задание), вам сначала нужно будет пометить данные, которые вы будете использовать для обучения модели, чтобы классифицировать данные в помеченные вами группы. Напротив, обучение без учителя не требует явной маркировки данных.

Q3- Чем KNN отличается от кластеризации k-средних?

Больше чтения: Чем алгоритм k-ближайшего соседа отличается от кластеризации k-средних? (Quora)

K-Nearest Neighbours - это алгоритм классификации под наблюдением, в то время как кластеризация k-средних является алгоритмом кластеризации без присмотра. Хотя механизмы на первый взгляд могут показаться схожими, на самом деле это означает, что для работы K-ближайших соседей вам нужны помеченные данные, в которые вы хотите классифицировать немеченую точку (таким образом, часть ближайшего соседа). Кластеризация K-средних требует только набора немаркированных точек и порога: алгоритм будет брать немеченые точки и постепенно узнавать, как их кластеризовать в группы, вычисляя среднее значение расстояния между различными точками.

Критическим отличием здесь является то, что KNN нуждается в помеченных точках и, следовательно, контролируется обучение, в то время как K-означает, что нет - и, следовательно, обучение без контроля.

Q4- Объясните, как работает кривая ROC.

Больше чтения: Рабочая характеристика приемника (Википедия)

Кривая ROC является графическим представлением контраста между истинно положительными показателями и ложно положительными показателями при различных порогах. Он часто используется в качестве прокси для компромисса между чувствительностью модели (истинные положительные результаты) и падением или вероятностью того, что это вызовет ложную тревогу (ложные срабатывания).

Он часто используется в качестве прокси для компромисса между чувствительностью модели (истинные положительные результаты) и падением или вероятностью того, что это вызовет ложную тревогу (ложные срабатывания)

Q5- Определить точность и вспомнить.

Больше чтения: Точность и отзыв (Википедия)

Напомним также известен как истинный положительный показатель: количество положительных результатов, заявленных вашей моделью, по сравнению с фактическим количеством положительных значений, присутствующих в данных. Точность также известна как положительное прогностическое значение и является мерой количества точных положительных значений, которые ваша модель утверждает в сравнении с количеством положительных значений, которые она фактически заявляет. Проще вспомнить о точности и точности в контексте случая, когда вы предсказали, что в случае 10 яблок было 10 яблок и 5 апельсинов. У вас было бы отличное воспоминание (на самом деле 10 яблок, и вы прогнозировали, что их будет 10), но точность 66,7%, потому что из 15 предсказанных вами событий только 10 (яблоки) верны.

Q6- Что такое теорема Байеса? Как это полезно в контексте машинного обучения?

Больше чтения: Интуитивное (и краткое) объяснение теоремы Байеса (лучше объяснено)

Теорема Байеса дает вам апостериорную вероятность события, учитывая то, что известно как предшествующее знание.

Математически это выражается как истинный положительный коэффициент выборки условия, деленный на сумму ложного положительного показателя совокупности и истинного положительного показателя состояния. Скажем, у вас была 60% -ная вероятность того, что вы действительно заболели гриппом после теста на грипп, но из людей, у которых был грипп, тест будет ложным в 50% случаев, и у всего населения есть только 5% шансов иметь грипп. Будет ли у вас 60% шанс заболеть гриппом после положительного теста?

Теорема Байеса говорит нет. Это говорит о том, что у вас есть (.6 * 0,05) (истинно положительная норма образца условия) / (.6 * 0,05) (истинно положительная ставка образца условия) + (.5 * 0,95) (ложно положительная ставка Население) = 0,0594 или 5,94% шансов заболеть гриппом.

Теорема Байеса - основа ветви машинного обучения, которая включает в себя наивный байесовский классификатор. Это важно учитывать, когда вы сталкиваетесь с вопросами интервью на машинное обучение.

Q7- Почему «наивный» байесовский наивен?

Больше чтения: Почему «наивный байесовский» наивен? (Quora)

Несмотря на практическое применение, особенно в текстовом майнинге, Naive Bayes считается «наивным», потому что он делает предположение, которое практически невозможно увидеть в реальных данных: условная вероятность рассчитывается как чистое произведение отдельных вероятностей компонентов. Это подразумевает абсолютную независимость функций - условие, которое, вероятно, никогда не встречалось в реальной жизни.

Как сказал причудливый комментатор Quora, наивный байесовский классификатор, который выяснил, что вам нравятся соленые огурцы и мороженое, вероятно, наивно порекомендует вам соленое мороженое.

Q8- Объясните разницу между регуляризацией L1 и L2.

Больше чтения: В чем разница между регуляризацией L1 и L2? (Quora)

Регуляризация L2 имеет тенденцию распространять ошибку среди всех членов, в то время как L1 является более двоичным / разреженным, причем многим переменным присваивается 1 или 0 в весовом выражении. L1 соответствует установке предварительного условия Лапласа на термах, в то время как L2 соответствует предшествующему гауссову.

L1 соответствует установке предварительного условия Лапласа на термах, в то время как L2 соответствует предшествующему гауссову

Вопрос 9. Какой твой любимый алгоритм, и можешь ли ты объяснить его мне менее чем за минуту?

Этот тип вопросов проверяет ваше понимание того, как сообщать сложные и технические нюансы с уравновешенностью и способностью быстро и эффективно обобщать. Убедитесь, что у вас есть выбор, и вы можете объяснить различные алгоритмы так просто и эффективно, чтобы пятилетний ребенок мог понять основы!

Q10- В чем разница между ошибками типа I и типа II?

Больше чтения: Ошибки типа I и типа II (Википедия)

Не думайте, что это вопрос с подвохом! Многие вопросы, связанные с интервью по машинному обучению, будут попыткой задать вам базовые вопросы, просто чтобы убедиться, что вы на вершине своей игры и подготовили все свои основы.

Ошибка типа I является ложно-положительной, а ошибка типа II - ложно-отрицательной. Вкратце, ошибка типа I означает утверждение, что что-то произошло, когда этого не произошло, а ошибка типа II означает, что вы утверждаете, что ничего не происходит, когда на самом деле что-то происходит.

Разумный способ думать об этом - думать об ошибке типа I как о том, что он говорит мужчине, что он беременен, а ошибка типа II означает, что вы говорите беременной женщине, что у нее нет ребенка.

Q11- Что такое преобразование Фурье?

Больше чтения: Преобразование Фурье (Википедия)

Преобразование Фурье - это обобщенный метод для разложения обобщенных функций в суперпозицию симметричных функций. Или как это более интуитивный учебник ставит, учитывая смузи, это то, как мы находим рецепт. Преобразование Фурье находит набор тактовых скоростей, амплитуд и фаз для согласования с любым временным сигналом. Преобразование Фурье преобразует сигнал от времени к частотной области - это очень распространенный способ извлечения признаков из аудиосигналов или других временных рядов, таких как данные датчиков.

Q12- В чем разница между вероятностью и вероятностью?

Больше чтения: В чем разница между «вероятностью» и «вероятностью»? (Перекрестная проверка)

В13 - Что такое глубокое обучение и как оно отличается от других алгоритмов машинного обучения?

Больше чтения: Глубокое обучение (Википедия)

Глубокое обучение - это подмножество машинного обучения, которое связано с нейронными сетями: как использовать обратное распространение и определенные принципы из нейробиологии для более точного моделирования больших наборов немеченых или полуструктурированных данных. В этом смысле глубокое обучение представляет собой алгоритм обучения без присмотра, который изучает представления данных с помощью нейронных сетей.

Q14- В чем разница между порождающей и дискриминационной моделью?

Больше чтения: В чем разница между генеративным и дискриминационным алгоритмом? (Переполнение стека)

Генеративная модель будет изучать категории данных, в то время как дискриминационная модель будет просто изучать различие между различными категориями данных. Дискриминационные модели, как правило, превосходят генеративные модели по задачам классификации.

В15 - Какой метод перекрестной проверки вы бы использовали в наборе данных временных рядов?

Больше чтения: Использование k-кратной перекрестной проверки для выбора модели временных рядов (CrossValidated)

Вместо того, чтобы использовать стандартную перекрестную проверку k-сгибов, вы должны обратить внимание на тот факт, что временные ряды не являются случайно распределенными данными - они по своей природе упорядочены в хронологическом порядке. Например, если шаблон появляется в более поздние периоды времени, ваша модель все еще может его использовать, даже если этот эффект не срабатывал в более ранние годы!

Вы захотите сделать что-то вроде прямой цепочки, где вы сможете смоделировать прошлые данные, а затем взглянуть на прямые данные.

  • сгиб 1: тренировка [1], тест [2]
  • сгиб 2: тренировка [1 2], тест [3]
  • сгиб 3: тренировка [1 2 3], тест [4]
  • сгиб 4: тренировка [1 2 3 4], тест [5]
  • сгиб 5: тренировка [1 2 3 4 5], тест [6]

Q16- Как обрезать дерево решений?

Больше чтения: Обрезка (деревья решений)

Сокращение - это то, что происходит в деревьях решений, когда ветви, которые имеют слабую предсказательную силу, удаляются, чтобы уменьшить сложность модели и повысить точность предсказания модели дерева решений. Сокращение может происходить снизу вверх и сверху вниз, с такими подходами, как сокращение ошибок и сокращение затрат.

Уменьшенное сокращение ошибок, пожалуй, самая простая версия: замените каждый узел. Если это не снижает прогнозирующую точность, подрежьте ее. Несмотря на простоту, эта эвристика фактически приближается к подходу, который оптимизировал бы для максимальной точности.

В17. Что для вас важнее: точность модели или ее производительность?

Больше чтения: Парадокс точности (Википедия)

Этот вопрос проверяет ваше понимание нюансов производительности модели машинного обучения! Вопросы интервью машинного обучения часто обращают внимание на детали. Существуют модели с более высокой точностью, которые могут работать хуже в предсказательной способности - как это имеет смысл?

Ну, это все, что связано с тем, что точность модели является лишь подмножеством производительности модели, а иногда и вводящей в заблуждение. Например, если вы хотите обнаружить мошенничество в огромном наборе данных с выборкой из миллионов, более точная модель, скорее всего, вообще не предскажет мошенничества, если только мошенничество будет совершено в подавляющем большинстве случаев. Однако это было бы бесполезно для прогностической модели - модели, разработанной для поиска мошенничества, которая утверждала, что мошенничества вообще не было! Подобные вопросы помогают вам продемонстрировать, что вы понимаете, что точность модели не является основной и конечной характеристикой модели.

Q18- Каков счет Ф1? Как бы вы использовали это?

Больше чтения: F1 счет (Википедия)

Оценка F1 - это показатель эффективности модели. Это средневзвешенное значение точности и отзыва модели, при этом результаты стремятся к 1, а лучшие - к 0, а худшие - к 0. Вы бы использовали его в классификационных тестах, где истинные негативы не имеют большого значения.

Q19- Как бы вы справились с несбалансированным набором данных?

Больше чтения: 8 тактик для борьбы с несбалансированными классами в наборе данных машинного обучения (Мастерство машинного обучения)

Несбалансированный набор данных - это когда у вас есть, например, классификационный тест, и 90% данных находятся в одном классе. Это приводит к проблемам: точность в 90% может быть искажена, если у вас нет предсказательной силы для другой категории данных! Вот несколько тактик преодоления горба:

1- Соберите больше данных даже для дисбалансов в наборе данных.

2- Повторите выборку набора данных, чтобы исправить дисбаланс.

3. Попробуйте использовать другой алгоритм в вашем наборе данных.

Здесь важно, чтобы вы хорошо понимали, какой ущерб может нанести несбалансированный набор данных, и как это сбалансировать.

Q20- Когда вы должны использовать классификацию над регрессией?

Больше чтения: Регрессия против классификации (Math StackExchange)

Классификация создает дискретные значения и наборы данных для строгих категорий, а регрессия дает непрерывные результаты, которые позволяют лучше различать различия между отдельными точками. Вы бы использовали классификацию по регрессии, если хотите, чтобы ваши результаты отражали принадлежность точек данных в вашем наборе данных к определенным категориям (например: если вы хотите узнать, было ли имя мужчиной или женщиной, а не просто как они соотносятся с мужчиной и женские имена.)

В21 - Назовите пример, где могут быть полезны методы ансамбля.

Больше чтения: Обучение ансамблю (Википедия)

Методы ансамбля используют комбинацию алгоритмов обучения, чтобы оптимизировать прогнозирование. Как правило, они уменьшают переоснащение моделей и делают модель более устойчивой (маловероятно, что на нее влияют небольшие изменения в данных обучения).

Вы могли бы перечислить некоторые примеры ансамблевых методов, от упаковки до повышения, до метода «набора моделей» и продемонстрировать, как они могут повысить предсказательную силу.

Q22- Как вы можете быть уверены, что не перегружаете модель?

Больше чтения: Как я могу избежать переоснащения? (Quora)

Это простое подтверждение фундаментальной проблемы в машинном обучении: возможность перенастройки обучающих данных и передачи шума этих данных в набор тестов, что дает неточные обобщения.

Есть три основных способа избежать переоснащения:

1- Сохраняйте модель проще: уменьшайте дисперсию, принимая во внимание меньшее количество переменных и параметров, тем самым удаляя часть шума в данных тренировки.

2- Используйте методы перекрестной проверки, такие как перекрестная проверка в k-кратном порядке.

3- Используйте методы регуляризации, такие как LASSO, которые штрафуют определенные параметры модели, если они могут вызвать переоснащение.

В23 - Какие методы оценки вы бы использовали для оценки эффективности модели машинного обучения?

Больше чтения: Как оценить алгоритмы машинного обучения (Мастерство машинного обучения)

Сначала вы должны разделить набор данных на обучающие и тестовые наборы или, возможно, использовать методы перекрестной проверки для дальнейшего сегментирования набора данных на составные наборы обучающих и тестовых наборов в данных. Затем вы должны реализовать выбор метрик производительности: вот довольно полный список , Вы можете использовать такие показатели, как оценка F1, точность и матрица путаницы. Здесь важно продемонстрировать, что вы понимаете нюансы того, как измеряется модель, и как выбирать правильные показатели производительности для правильных ситуаций.

Q24- Как бы вы оценили модель логистической регрессии?

Больше чтения: Оценка логистической регрессии (CrossValidated) , Логистическая регрессия на простом английском

Подраздел вопроса выше. Вы должны продемонстрировать понимание того, каковы типичные цели логистической регрессии (классификация, прогнозирование и т. Д.) И привести несколько примеров и вариантов использования.

В25 - Что такое «трюк с ядром» и чем он полезен?

Больше чтения: Метод ядра (Википедия)

Трюк с ядром включает в себя функции ядра, которые могут включаться в пространствах более высокого измерения без явного вычисления координат точек в этом измерении: вместо этого функции ядра вычисляют внутренние произведения между изображениями всех пар данных в пространстве признаков. Это позволяет им очень полезный атрибут вычисления координат более высоких измерений, будучи в вычислительном отношении более дешевым, чем явное вычисление указанных координат. Многие алгоритмы могут быть выражены через внутренние продукты. Использование трюка с ядром позволяет нам эффективно запускать алгоритмы в многомерном пространстве с низкоразмерными данными.

(Узнайте о Springboard's AI / Машинное обучение Bootcamp первый в своем роде с гарантией работы.)

)

Вопросы по машинному обучению: программирование

Эти вопросы по машинному обучению проверяют ваши знания принципов программирования, которые вам необходимы для практического применения принципов машинного обучения. Вопросы для интервью с машинным обучением, как правило, являются техническими вопросами, которые проверяют вашу логику и навыки программирования.

Q26- Как вы обрабатываете отсутствующие или поврежденные данные в наборе данных?

Больше чтения: Обработка пропущенных данных (О'Рейли)

Вы можете найти отсутствующие / поврежденные данные в наборе данных и либо удалить эти строки или столбцы, либо принять решение заменить их другим значением.

В Pandas есть два очень полезных метода: isnull () и dropna (), которые помогут вам найти столбцы данных с отсутствующими или поврежденными данными и удалить эти значения. Если вы хотите заполнить недопустимые значения заполнителем (например, 0), вы можете использовать метод fillna ().

Q27- У вас есть опыт работы с Spark или инструментами больших данных для машинного обучения?

Больше чтения: 50 лучших инструментов с открытым исходным кодом для больших данных (Datamation)

Вы захотите ознакомиться со значением больших данных для разных компаний и различными инструментами, которые им нужны. Spark - наиболее востребованный инструмент для работы с большими данными, способный быстро обрабатывать огромные наборы данных. Будьте честны, если у вас нет опыта работы с требуемыми инструментами, но также взгляните на должностные инструкции и посмотрите, какие инструменты появляются: вы захотите инвестировать в ознакомление с ними.

Q28- Выберите алгоритм. Напишите псевдо-код для параллельной реализации.

Больше чтения: Написание псевдокода для параллельного программирования (Stack Overflow)

Этот тип вопроса демонстрирует вашу способность мыслить параллельно и то, как вы справляетесь с параллелизмом в реализациях программирования, работающих с большими данными. Взгляните на рамки псевдокода, такие как Периль-L и инструменты визуализации, такие как Схемы веб-последовательности чтобы помочь вам продемонстрировать свою способность писать код, отражающий параллелизм.

Q29- Каковы некоторые различия между связанным списком и массивом?

Больше чтения: Массив и связанный список (переполнение стека)

Массив - это упорядоченная коллекция объектов. Связанный список - это серия объектов с указателями, которые указывают, как обрабатывать их последовательно. Массив предполагает, что каждый элемент имеет одинаковый размер, в отличие от связанного списка. Связанный список может легко расти органически: массив должен быть заранее определен или переопределен для органического роста. Перестановка связанного списка включает в себя изменение того, какие точки направлены куда-то, а перестановка массива более сложна и занимает больше памяти.

Q30- Опишите хеш-таблицу.

Больше чтения: Хеш-таблица (Википедия)

Хеш-таблица - это структура данных, которая создает ассоциативный массив. Ключ сопоставляется с определенными значениями с помощью хэш-функции. Они часто используются для таких задач, как индексация базы данных.

В31 - Какие библиотеки визуализации данных вы используете? Что вы думаете о лучших инструментах визуализации данных?

Больше чтения: 31 Бесплатные инструменты визуализации данных (трамплин)

Здесь важно определить ваши взгляды на то, как правильно визуализировать данные и ваши личные предпочтения, когда дело доходит до инструментов. Популярные инструменты включают R's ggplot, Python Seaborn и Matplotlib, а также такие инструменты, как Plot.ly и Tableau.

Связанные : 20 Python Интервью Вопросы

Интервью по машинному обучению: компания / отрасль

Эти вопросы о машинном обучении касаются того, как применить свои общие знания в области машинного обучения к требованиям конкретной компании. Вам будет предложено создать тематические исследования и расширить свои знания о компании и отрасли, на которую вы претендуете, с помощью своих навыков машинного обучения.

Q32- Как бы вы внедрили систему рекомендаций для пользователей нашей компании?

Больше чтения: Как внедрить систему рекомендаций? (Переполнение стека)

Многие вопросы такого рода, связанные с машинным обучением, будут включать внедрение моделей машинного обучения в задачи компании. Вам нужно будет тщательно изучить компанию и ее отрасль, особенно те источники дохода, которые есть у компании, и типы пользователей, которых она привлекает в контексте отрасли, в которой она находится.

Q33- Как мы можем использовать ваши навыки машинного обучения для получения дохода?

Больше чтения: Метрики стартапов для стартапов (500 стартапов)

Это сложный вопрос. Идеальный ответ будет демонстрировать знание того, что движет бизнесом и как ваши навыки могут быть связаны. Например, если вы брали интервью у стартапа Spotify с потоковой передачей музыки, вы могли бы заметить, что ваши навыки по разработке более совершенной модели рекомендаций повысят удержание пользователей, что затем увеличит доход в долгосрочной перспективе.

Показатели стартапов Slideshare, приведенные выше, помогут вам точно понять, какие показатели эффективности важны для стартапов и технологических компаний, когда они думают о доходах и росте.

Q34- Что вы думаете о нашем текущем процессе обработки данных?

Больше чтения: Электронный курс по науке о данных - трамплин

Больше чтения:   Электронный курс по науке о данных - трамплин

Этот вопрос требует от вас внимательного прослушивания и передачи обратной связи в конструктивной и проницательной форме. Ваш интервьюер пытается определить, являетесь ли вы ценным членом их команды и понимаете ли вы нюансы того, почему определенные вещи устанавливаются так, как они находятся в процессе обработки данных компании, исходя из условий конкретной компании или отрасли. Они пытаются понять, можете ли вы быть интеллектуальным пэром. Действуй соответственно.

Вопросы по машинному обучению: Общий интерес к машинному обучению

Эта серия вопросов об обучении машинному обучению пытается измерить вашу страсть и интерес к машинному обучению. Правильные ответы послужат свидетельством вашего стремления быть машинным обучением на протяжении всей жизни.

Q35- Какие последние статьи по машинному обучению вы прочитали?

Больше чтения: Каковы некоторые из лучших исследовательских работ / книг для машинного обучения?

Если вы хотите проявить интерес к позиции машинного обучения, необходимо быть в курсе новейшей научной литературы по машинному обучению. Этот обзор глубокое обучение на природе сами отростки глубокого обучения (от Хинтона до Бенжио и ЛеКуна) могут стать хорошим справочным документом и обзором того, что происходит в процессе глубокого обучения, - и тем документом, который вы, возможно, захотите процитировать.

Q36- У вас есть опыт исследований в области машинного обучения?

В связи с последним пунктом, большинство организаций, нанимающих на должности машинного обучения, будут искать ваш формальный опыт в этой области. Научно-исследовательские работы, написанные в соавторстве или под руководством лидеров в данной области, могут иметь значение между тем, что вас нанимают, а кого нет. Убедитесь, что у вас есть краткий обзор вашего исследовательского опыта и готовые документы - и объяснение вашего прошлого и отсутствие официального исследовательского опыта, если вы этого не сделаете.

Q37 - Какие ваши любимые варианты использования моделей машинного обучения?

Больше чтения: Каковы типичные варианты использования для различных алгоритмов машинного обучения? (Quora)

Поток Quora выше содержит несколько примеров, таких как деревья решений, которые классифицируют людей на разные уровни интеллекта на основе оценок IQ. Убедитесь, что вы имеете в виду несколько примеров и опишите, что вызвало у вас отклик. Важно, чтобы вы проявили интерес к тому, как реализовано машинное обучение.

Q38- Как бы вы подошли к конкурсу Netflix Prize?

Больше чтения: Netflix Prize (Википедия)

Премия Netflix была знаменитым конкурсом, в котором Netflix предложил 1 000 000 долларов за лучший алгоритм совместной фильтрации. Команда, которая победила под названием BellKor, имела улучшение на 10% и использовала множество различных методов для победы. Некоторое знакомство с делом и его решением поможет продемонстрировать, что вы какое-то время уделяли внимание машинному обучению.

Q39- Где вы обычно получаете наборы данных?

Больше чтения: 19 бесплатных общедоступных наборов данных для вашего первого проекта Data Science (трамплин)

Подобные вопросы об обучении машинному обучению пытаются стать основой вашего интереса к машинному обучению. Кто-то, кто по-настоящему увлечен машинным обучением, сам уйдет и сделает побочные проекты, и у него будет хорошее представление о том, какие классные наборы данных существуют. Если вам не хватает, проверьте Quandl для экономических и финансовых данных, и Наборы данных Kaggle Коллекция для другого великого списка.

Q40- Как вы думаете, Google обучает данные для автомобилей с автоматическим управлением?

Больше чтения: Waymo Tech

Подобные вопросы интервью с машинным обучением действительно проверяют ваши знания различных методов машинного обучения и вашу изобретательность, если вы не знаете ответа. Google в настоящее время использует Recaptcha источник помеченных данных на витринах и дорожных знаках. Они также опираются на данные тренировок, собранные Себастьяном Труном в GoogleX - некоторые из них были получены его аспирантами, водящими багги по пустынным дюнам!

Q41- Как бы вы смоделировали подход AlphaGo, чтобы победить Ли Сидола на Go?

Больше чтения: Освоение игры Go с глубокими нейронными сетями и поиском деревьев (Природа)

АльфаГо, победивший Ли Сидола, лучшего человека на Go, в серии из пяти лучших, стал поистине плодотворным событием в истории машинного обучения и глубокого обучения. В статье «Природа», описанной выше, описывается, как это было достигнуто с помощью «поиска дерева Монте-Карло с использованием глубоких нейронных сетей, которые были обучены с помощью обучения под наблюдением, игр с участием человека-эксперта и обучения с подкреплением из игр самоигры».

Связанные : 40 вопросов об искусственном интеллекте

Хотите получить роль инженера по машинному обучению? Узнайте о Springboard's Карьерный трек AI / Machine Learning первый в своем роде с гарантией работы.

Узнайте о Springboard's   Карьерный трек AI / Machine Learning   первый в своем роде с гарантией работы

Похожие

Миллиардеры работают на меня - Мак Вален [интервью] - Doradca.tv
«Фондовый рынок - это такой бизнес для вложений. Я не управляю данной компанией, но я присоединяюсь к ней, покупая ее акции, и я получаю выгоду от ее прибыли и развития. Миллиардеры работают на меня », - говорит Мак Вален, инвестор и предприниматель, который живет в Таиланде более десяти лет. Если вы прочитали текст с объявлением инвестировать в азиатский
Украинские сладости в Польше. Порошенко Рошен компания в Польше
Рошен, украинский гигант Петр Порошенко, мировой гигант на рынке кондитерских изделий, зарегистрировался в Польше, сообщает "Puls Biznesu". Он хочет стать одним из пяти крупнейших игроков на нашем рынке в течение 5 лет.
»Методы и инструменты оценки || Librus.pl
... интервью с представителями учеников, родителей и учителей и групповое обсуждение с представителями всех этих групп, чтобы узнать позиции друг друга. Время выполнения этого метода короткое - 5-7 дней. Мероприятия начинаются с подготовки вопросов для проведения внутренней оценки в объеме, указанном ее субъектом. Реализация метода «школьный профиль» можно разделить на четыре этапа. Первый этап проходит в трех отдельных группах (учителя,
... польский языки. Предназначен для индивидуального обучения на работе - заканчивая сертификатом Платформа эл...
... польский языки. Предназначен для индивидуального обучения на работе - заканчивая сертификатом Платформа электронного обучения предназначена для индивидуального обучения на работе, например, во время перерывов в работе на банкоматах. Поэтому главы являются краткими и дополнены формой, гарантирующей, что пользователь понял содержание. Подразделения охватывают основы органического сектора (органическое сельское хозяйство, перерабатывающие и торговые
Программирование ударных: непрерывный барабан и бас - журнал Attack
Программирование ударных: непрерывный барабан и бас Наш человек на драм-машине берет базовый ритм D & B и толкает его дальше и толще, создавая непрерывный, скользящий, управляемый перерывами удар. Beat Dissected - это регулярная серия, которая разбирает барабанные паттерны, показывая, как их воссоздать в любой DAW. Просто скопируйте
SAT Prep Resources
Ваши оценки по SAT могут оказать большое влияние на вашу карьеру в колледже. Высокие баллы могут привести вас к стипендии, гранты, льготы класса и многое другое. Идея изучения всего материала по SAT может быть ошеломляющим опытом для некоторых активных студентов. Тем не менее, ресурсы, приведенные в этой статье, могут помочь вам усердно учиться,
Girotti Machine Ltd. получает + 22 тыс. Долларов на гранты на обучение в Онтарио
Компания Girotti Machine Ltd. из Сент-Катаринса получила гранты на обучение в Онтарио почти на 23 000 долларов, и это только начало их планов финансирования . Государственное финансирование позволило компании провести техническое обучение для своих 40 сотрудников. Недавно производитель включил финансирование в процесс стратегического планирования для поддержки будущих проектов. Для реализации своего плана развития рабочей силы Girotti Machine Ltd. получила
Что является основным оборудованием парикмахерской?
Тщательно подобранное оборудование парикмахерской способствует его популярности. Посмотрите, чем должна быть оборудована парикмахерская. Уже давно известно, что успех парикмахерской - это не только результат парикмахерских навыков, но и общее качество услуг и оборудования в гостиной! Все популярные
Центр обслуживания клиентов Dell EMC в Праге
... поддерживают преобразование рабочей силы, преобразование ИТ (цифровое) и преобразование безопасности (как защитить всю систему). Это соответствует отдельным бренди, особенно Dell Technologies, Dell EMC, VMware, Pivotal, VirtuStream, SecureWorks и RSA. Иржи Кисела также представил результаты продаж серверов и хранилищ IDC Куда Dell EMC явно ведет. Иржи Кисела добавил, что после преобразования
Как анонимно оплатить онлайн и в домашних магазинах?
Эльдорадо, связанный с потоком предоплаченных платежных карт, постепенно подходит к концу. В настоящее время, вероятно, ни один польский банк не предлагает такой безымянный способ анонимной оплаты товаров и услуг в Интернете. Есть ли другой метод
Windows Tablet Test & Сравнение 2019
Самое главное вкратце Внешне планшет Windows практически не отличается от устройств, работающих на Android или iOS. Уникальным преимуществом планшета Windows является операционная система Windows, оптимизированная для работы с сенсорным экраном. Если планшет Windows также оснащен мышью и клавиатурой, вы держите в руках устройство, которое очень близко подходит к ноутбуку и планшету. Совместимость устройств оценивается различными вариантами подключения через HDMI и USB.

Комментарии

Находят ли ваши идеи интерес среди простых работающих людей?
Находят ли ваши идеи интерес среди простых работающих людей? Такие подробные данные - у нас нет профессионального профиля людей, которые покупают такие компьютеры. После масштабов продаж можно догадаться, что это не только крупные компании, но и их генеральные директора. В сегменте компьютеров класса люкс мы занимаем первое место в Польше по объему продаж. У нас 38 процентов премиальный рынок. Даже если мы разделим его на две отдельные категории - роскошные ноутбуки и роскошные
3. Что может снизить интерес к органическим продуктам?
3. Что может снизить интерес к органическим продуктам? Источник: собственное исследование В ответ на вопрос, что может снизить интерес к органическим продуктам, наиболее часто указанная цена составляла 70% от всех приведенных ответов (Рисунок 3). Цены на органические продукты от нескольких десятков до нескольких сотен процентов выше, чем на обычные продукты. Это связано с м.в. при слабом развитии этого аграрного сектора значительная доля иностранной продукции. Для многих
Еще один важный вопрос: может ли компания продемонстрировать факт проведения оценки воздействия на конфиденциальность?
Еще один важный вопрос: может ли компания продемонстрировать факт проведения оценки воздействия на конфиденциальность? Таким образом, конфиденциальность и защита данных будут измеримыми и управляемыми. Это роль Оценки воздействия на конфиденциальность (иногда ее называют оценкой воздействия на конфиденциальность, оценкой воздействия на конфиденциальность): измерение конфиденциальности и защиты данных, проектирование, разработка, обновление, обслуживание приложений, систем и продуктов
А сколько именно стоит компания?
А сколько именно стоит компания? Я приглашаю вас изучить практические советы и простое объяснение темы. Каковы затраты компании Большим преимуществом ведения вашего бизнеса является способность оплачивать фактические расходы, понесенные при ведении бизнеса. Корпоративные расходы - это расходы на получение дохода или обеспечение источников дохода. Поэтому очень важно, чтобы данные расходы были связаны с вашим бизнесом. В то же время, нет
Какая компания имеет самый удобный сайт?
Какая компания имеет самый удобный сайт? Ознакомьтесь с последним отчетом mfind, в котором мы представляем рейтинг услуг прямых страховщиков, работающих на польском рынке. Прямой страховой рынок в Польше Нет сомнений link4 он начал существование прямого рынка в Польше и революционизировал мышление о страховании, оставаясь в течение трех лет после своего дебюта единственной компанией, предлагающей клиенту покупку полиса без необходимости
Откуда такой интерес к водительским правам со стороны представительниц прекрасного пола?
Откуда такой интерес к водительским правам со стороны представительниц прекрасного пола? - В нашей стране стало появляться все больше автомобилей, они стали дешевле и стали общедоступными. Семьи получили возможность часто иметь несколько транспортных средств. Естественно, что женщины стали все больше и больше участвовать в дорожном движении. Подобные явления могли наблюдаться несколько десятилетий назад на западе, - объясняет доктор Сильвия Милевска, транспортный психолог. Женщины
Как насчет обучения на высоком уровне, чтобы вы могли действовать, чтобы стать тем, кем вы себя знаете?
Как насчет обучения на высоком уровне, чтобы вы могли действовать, чтобы стать тем, кем вы себя знаете? Я тебя прикрыл. Тысячи мужчин заплатили мне тысячи долларов за тренировки стиля ... и они сказали мне, что это окупилось за счет увеличения доходов и успеха. Теперь я раздаю некоторые из этих секретов бесплатно. Нажмите здесь, чтобы проверить
Мы можем ответить на такие вопросы, как - фотография недоэкспонирована или переэкспонирована?
Мы можем ответить на такие вопросы, как - фотография недоэкспонирована или переэкспонирована? Фокус установлен там, где и должен? Достаточна ли глубина резкости? Хотя мы можем сделать эти оценки визуально, цифровые камеры предлагают ряд инструментов, которые позволяют им быть быстрее и увереннее. Одной из таких функций является гистограмма фотографии . Предварительный просмотр зеркальной камеры Sony α550 предлагает удобное меню, в котором мы можем ее просмотреть. Гистограмма также
Вас интересует тема и есть дополнительные вопросы?
Вас интересует тема и есть дополнительные вопросы? Хотели бы вы получить ДЕМО версию? Или, может быть, вы заинтересованы в презентации наших решений? Свяжитесь с нами, используя форму ниже:
Такие вопросы, как: «Как мне покинуть мою зону комфорта?
Такие вопросы, как: «Как мне покинуть мою зону комфорта? Где я могу позволить жидкие структуры? Как мне развить новые инновационные возможности? " Место проведения: Дом мировых культур, Берлин Стоимость: С марта 649 евро Возможны групповые скидки для профессионалов и студентов (от 5 до 10 человек) webinale С 29 мая по 2 июня 2017 г.
У вас есть вопросы?
У вас есть вопросы? Самый простой способ определить, нуждается ли моя компания в таком решении, состоит в том, чтобы принять во внимание критерий размера занятости и текучести кадров в компании. Если годовой оборот компании составляет 20-30 миллионов злотых, то такой маленький инструмент BI должен решить. В случае компаний с более низким оборотом ключевым критерием является субъект деятельности. Нужна ли такая система брокеру, в котором работает 10 человек, и его бизнес полагается

Q1- Каков компромисс между смещением и дисперсией?
Q2- В чем разница между контролируемым и неконтролируемым машинным обучением?
Q3- Чем KNN отличается от кластеризации k-средних?
Q6- Что такое теорема Байеса?
Как это полезно в контексте машинного обучения?
Будет ли у вас 60% шанс заболеть гриппом после положительного теста?
Q7- Почему «наивный» байесовский наивен?
9. Какой твой любимый алгоритм, и можешь ли ты объяснить его мне менее чем за минуту?
Q10- В чем разница между ошибками типа I и типа II?
Q11- Что такое преобразование Фурье?