Работа с таблицами

При выборе csv-файла автоматически открывается поле для выбора обработчиков для каждой из колонок.

В зависимости от типа слоя, обработчики делятся на две категории:

Типы обработчиков.

Входные

Выходные

Изображения

Классификация

Текст

Регрессия

Аудио

Сегментация

Видео

Временные ряды

Уникальные

Скейлер

Note

Допускается выбор колонки в слое без привязки колонки к обработчику, однако в таком случае колонка должна быть полность заполнена и содержать только числовые значения (при дробных числах в качестве разделителя должна являться .).


Изображения

Колонка должна содержать относительные пути к изображениям, находящимся в одном архиве вместе с выбранной таблицей.

Пример таблицы.

Путь к картинке

imgs/image-001.jpg

imgs/image-002.jpg

imgs/image-003.jpg

imgs/image-004.jpg

Ширина

В поле Ширина следует ввести целочисленное значение ширины картинки при создании массивов.

Высота

В поле Высота следует ввести целочисленное значение высоты картинки при создании массивов.

Сеть

Режим Сверточный не предполагает никаких операций с полученным после чтения изображения массивом.

Режим Линейный предполагает перевод массива изображения в векторное представление. Например, трёхканальное изображение 100х100 из массива с размерностью (100, 100, 3) превратится в (30000,).

изображения_сеть.png

Note

После перевода массивов изображения в векторное представление нельзя будет использовать сверточный слой в качестве первого слоя в нейронной сети.

Режим изображения

Режим Растянуть подгоняет исходное изображение под заданную высоту и ширину, не сохраняя её пропорции.

Режим Вписать подгоняет исходное изображение под заданную высоту и ширину с сохранением пропорций исходного изображения. Если заданные параметры высоты или ширины оказались больше исходного изображения, лишнее пространство изображения заполняется чёрным цветом.

Режим Обрезать подгоняет исходное изображение под заданную высоту и ширину, обрезая невошедшее в рамки заданной ширины и высоты исходя из центра изображения. Если исходное изображение оказалось меньше заданной высоты и ширины, или одна из её сторон оказалась меньше, лишнее пространство изображения заполняется чёрным цветом.

Режимы изображения. Размер обработанных картинок - 500х500px

Растянуть

Вписать

Обрезать

изображения_цветок_растянуть.png

Оригинал - 300х200px

изображения_цветок_растянуть.png

Оригинал - 300х200px

изображения_цветок_растянуть.png

Оригинал - 300х200px

изображения_цветок_растянуть.png

Оригинал - 600х950px

изображения_цветок_растянуть.png

Оригинал - 600х950px

изображения_цветок_растянуть.png

Оригинал - 600х950px

Скейлер

MinMaxScaler

В процессе обучения данный объект проводит поиск среди всех значений массивов с целью нахождения минимального и максимального значения. В дальнейшем, при использовании скейлера для трансформирования массива, все элементы интерполируются в диапазоне между минимальным и максимальным значением и значениями, указанными в полях Минимальный скейлер и Максимальный скейлер.

Пример трансформации вектора с использованием MinMaxScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

0.0

0.08

0.15

0.27

0.42

0.55

0.73

0.80

0.88

1.0

TerraImageScaler

В процессе обучения данный объект проводит поиск среди всех значений массивов изображений с целью нахождения минимального и максимального значений индивидуально для каждого пикселя и каждого из трёх RGB каналов. В дальнейшем, при использовании скейлера для трансформирования массивов изображений, все значения каждого пикселя по трём RGB каналам интерполируются в собственном диапазоне минимального и максимального значений между 0 и 1.

Note

Использование данного скейлера с режимом сети Линейный невозможно.

Не применять

При выборе данного режима никаких трансформаций массивов происходить не будет.


Видео

Колонка должна содержать относительные пути к видеофайлам, находящимся в одном архиве вместе с выбранной таблицей.

Пример таблицы.

Путь к видео

videos/vid-001.avi

videos/vid-002.avi

videos/vid-003.avi

videos/vid-004.avi

Ширина кадра

В поле Ширина кадра следует ввести целочисленное значение ширины видеокадра при создании массивов.

Высота кадра

В поле Высота кадра следует ввести целочисленное значение высоты видеокадра при создании массивов.

Заполнение недостающих кадров

Режим Последним кадром копирует последний кадр видео.

Режим Средним значением формирует последний кадр исходя из среднего значения каждого пикселя на протяжении всего видео. На таком кадре все движущиеся объекты будут размыты.

Режим Зациклить добавляет новый видеоряд путём перемотки видео до тех пор, пока количество кадров не достигнет требуемого.

Заполнение недостающих кадров.

Последним кадром

Средним значением

Зациклить

видео_черными кадрами.gif
видео_последним кадром.gif
видео_зациклить.gif

Обработка кадров

Режим Растянуть подгоняет каждый кадр под заданную высоту и ширину, не сохраняя её пропорции.

Режим Вписать подгоняет каждый кадр под заданную высоту и ширину с сохранением пропорций исходного кадра. Если заданные параметры высоты или ширины оказались больше исходного кадра, лишнее пространство заполняется чёрным цветом.

Режим Обрезать подгоняет каждый кадр под заданную высоту и ширину, обрезая невошедшее в рамки заданной ширины и высоты исходя из центра кадра. Если исходный кадр оказалось меньше заданной высоты и ширины, или одна из её сторон оказалась меньше, лишнее пространство заполняется чёрным цветом.

Режимы видео. Размер оригинального кадра - 240х320px

Растянуть

Вписать

Обрезать

видео_растянуть.png

100х150px

видео_вписать.png

100х150px

видео_обрезать.png

100х150px

видео_растянуть_2.png

300х350px

видео_вписать_2.png

300х350px

видео_обрезать_2.png

300х350px

Скейлер

MinMaxScaler

В процессе обучения данный объект проводит поиск среди всех значений массивов с целью нахождения минимального и максимального значения. В дальнейшем, при использовании скейлера для трансформирования массива, все элементы интерполируются в диапазоне между минимальным и максимальным значением и значениями, указанными в полях Минимальный скейлер и Максимальный скейлер.

Пример трансформации вектора с использованием MinMaxScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

0.0

0.08

0.15

0.27

0.42

0.55

0.73

0.80

0.88

1.0

Не применять

При выборе данного режима никаких трансформаций массивов происходить не будет.


Аудио

Колонка должна содержать относительные пути к аудиофайлам, находящимся в одном архиве вместе с выбранной таблицей.

Пример таблицы.

Путь к аудио

audio_1/audio-001.wav

audio_1/audio-002.wav

audio_1/audio-003.wav

audio_2/audio-001.wav

Частота дискретизации

Параметр Частота дискретизации указывает на количество измерений аудиосигнала в секунду.

Заполнение недостающих аудио-дорожек

Режим Последней миллисекундой копирует последнюю миллисекунду аудиофайла на протяжении всего недостающего отрезка.

Режим Зациклить заполняет недостающий отрезок аудиофайла путём копирования фрагмента обрабатываемого аудиофайла и добавление в него до тех пор, пока не будет заполнен недостающий отрезок.

аудио_по_длине_и_шагу.png

Пример обработки аудиофайла длиной 0.7сек. и частотой дискретизации 22050 режимом Зациклить до 1сек. Желтым обозначен копируемый фрагмент, зеленым - заполненный.

Параметр

Audio signal

Чистый аудиосигнал без обработки. Длина аудиосигнала равна частоте дискретизации умноженной на длину аудиофайла в секундах.

Чистый аудиосигнал в дальнейшем используется для расчета следующих параметров аудио (при их выборе):

Chroma STFT

Хромаграмма или хроматический вектор обычно представлен набором признаков из 12 элементов, характеризующих интенсивность полутонов музыкальной гаммы (C = до, C# = до диез, D = ре, D# = ре диез и так далее) в исследуемом звуке. Используется для выделения и анализа мелодических признаков в музыкальном аудиосигнале.

MFCC

Представляют собой небольшой набор признаков (обычно 10–20), которые кратко описывают структуру спектра звука. Фильтры, которыми выделяются коэффициенты, основаны на особенностях человеческого восприятия звука: древним людям важнее было распознавать низкочастотные звуки, что отразилось в эволюции органов слуха.

RMS

Spectral centroid

Спектральный центроид указывает вблизи какой частоты сосредоточена большая часть энергии спектра. Другими словами, указывает, где расположен «центр масс» звука.

Spectral bandwidth

Spectral roll-off

Мера формы сигнала, представляющая собой частоту, выше которой энергия звука практически отсутствует. Для ее получения определяют частотную границу, ниже которой лежит 85% всей мощности аудиосигнала.

Zero-crossing rate

Частота (или скорость) пересечения нуля соответствует общей оценке тембра звучания по шкале высокий/низкий, глухой/звонкий, шипящий/свистящий.

Ресемпл

Тип ресемпла, используемый во время открытия аудиофайлов. Сильно влияет на скорость формирования датасета. Список доступных типов (в порядке возрастания скорости): Kaiser best, Kaiser fast, Scipy. Более подробно можно прочитать здесь.

Скейлер

MinMaxScaler

В процессе обучения данный объект проводит поиск среди всех значений массивов с целью нахождения минимального и максимального значения. В дальнейшем, при использовании скейлера для трансформирования массива, все элементы интерполируются в диапазоне между минимальным и максимальным значением и значениями, указанными в полях Минимальный скейлер и Максимальный скейлер.

Пример трансформации вектора с использованием MinMaxScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

0.0

0.08

0.15

0.27

0.42

0.55

0.73

0.80

0.88

1.0

StandardScaler

При обучении скейлер проводит поиск среди всех значений массивов с целью находждения дисперсии, среднего значения. При использовании скейлера трансформация массивов происходит по формуле (x - среднее значение) / дисперсия.

Пример трансформации вектора с использованием StandardScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

-1.44

-1.20

-1.00

-0.65

-0.21

0.20

0.71

0.91

1.17

1.51

Не применять

При выборе данного режима никаких трансформаций массивов происходить не будет.


Текст

В качестве данных для текстового обработчика необходимо выбрать колонку с текстовым содержимым.

Фильтры

Поле Фильтры содержит в себе набор символов, которые будут удалены в процессе обработки текстовых файлов.

Pymorphy

При использовании Pymorphy слова будут переведены в инфинитив. Подробнее на странице документации Pymorphy2.

Метод подготовки

Режимы Embedding и Bag of words во время обработки текстов используют объект Tokenizer. При выборе данных режимов в поле Максимальное количество слов необходимо ввести длину словаря частотности слов, который образуется в процессе обучения данного объекта. При формировании словаря каждому уникальному слову присваивается индекс. Чем чаще встречается слово в тексте, тем меньше будет значение присвоенного индекса (самому популярному слову присваивается индекс 2). Если слово вышло за рамки словаря частотности слов, ему присваивается индекс 1. Словарь используется в процессе перевода текстовых данных в числовые.

Режим Word2Vec во время обработки текстов использует объект Word2Vec. После выбора данного режима открывается поле Размер Word2Vec пространства, в котором обозначается размер n-мерного пространство для слов.

Embedding

При выборе режима Embedding содается вектор длиной равным значению в поле Длина и с индексами слов, исходя из словаря частотности. В случае, если в текстовом файле количество слов меньше введённого пользователем числа, при формировании массивов они будут дописаны нулями.

Режим Embedding.

Съешь

ещё

этих

мягких

булочек

да

выпей

чаю.

438

132

33

301

182

19

387

101

Полученный вектор (при условии параметра Длина равным 10): [438, 132, 33, 301, 182, 19, 387, 101, 0, 0]

Bag of words

При выборе режима Bag of words содается вектор из нулей длиной в Максимальное количество слов, и заполняется единицами исходя из индексов слов в словаре частотности. При этом порядок слов утрачивается. Рассмотрим пример одного предложения с Максимальное количество слов равным 15 (условимся, что все слова из предложения попали в 15 самых наиболее встречающихся слов).

Режим Bag of words.

Миша

любит

кататься

на

горках

и

на

санках.

3

6

14

2

12

5

2

13

Полученный вектор: [0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1]

Word2Vec

При выборе режима Word2Vec массивы формируются исходя из обученного векторного пространства слов объекта Word2Vec. Длина вектора каждого слова имеет длину равной длине векторного пространства, установленной в параметре Размер Word2Vec пространства. Рассмотрим пример предложения с Размер Word2Vec пространства равным 2 (стандартным является значение 200, однако для демонстрационных целей в данной документации применим значение 2).

Режим Word2Vec.

Съешь

ещё

этих

мягких

булочек

да

выпей

чаю.

[0.1971.. 0.1885..]

[0.1132.. 0.1560..]

[0.2349.. 0.0148..]

[0.1552.. -0.1250..]

[0.1177.. -0.1929..]

[-0.2087.. 0.0028..]

[0.2432.. 0.0589..]

[0.1813.. -0.0266..]

Полученный вектор (при условии параметра Длина равным 10): [[0.1971.. 0.1885..], [0.1132.. 0.1560..], [0.2349.. 0.0148..], [0.1552.. -0.1250..], [0.1177.. -0.1929..], [-0.2087.. 0.0028..], [0.2432.. 0.0589..], [0.1813.. -0.0266..], [0 0], [0 0]]


Скейлер

В качестве данных для скейлера необходимо выбрать колонку с числовыми данными.

Note

Колонка должна содержать только числовые данные с разделителем . и должна быть полность заполнена. Запись числа в формате 22,200.50 не допускается.

MinMaxScaler

В процессе обучения данный объект проводит поиск среди всех значений массивов с целью нахождения минимального и максимального значения. В дальнейшем, при использовании скейлера для трансформирования массива, все элементы интерполируются в диапазоне между минимальным и максимальным значением и значениями, указанными в полях Минимальный скейлер и Максимальный скейлер.

Пример трансформации вектора с использованием MinMaxScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

0.0

0.08

0.15

0.27

0.42

0.55

0.73

0.80

0.88

1.0

StandardScaler

При обучении скейлер проводит поиск среди всех значений массивов с целью находждения дисперсии, среднего значения. При использовании скейлера трансформация массивов происходит по формуле (x - среднее значение) / дисперсия.

Пример трансформации вектора с использованием StandardScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

-1.44

-1.20

-1.00

-0.65

-0.21

0.20

0.71

0.91

1.17

1.51

Не применять

При выборе данного режима никаких трансформаций массивов происходить не будет.


Уникальные

В качестве данных для скейлера принимается колонка с любым типом данных.

Note

Обратите внимание, что поиск классов осуществляется через поиск уникальных значений. Таким образом, “Машина” и “машина” будут являться разными классами.

One-Hot encoding

Перевод числового значения в формат One-Hot encoding.

Перевод в OHE (4 класса).

Номер класса

Формат OHE

0

[1, 0, 0, 0]

1

[0, 1, 0, 0]

2

[0, 0, 1, 0]

3

[0, 0, 0, 1]

Тип предобработки

При выборе типа По категориям каждому значению в колонке будет присвоен номер класса в зависимости от общего количества уникальных значений в столбце.

При выборе типа По диапазонам появится поле ввода диапазонов, на которые необходимо разбить данные в колонке, которая должна содержать только числовые данные. Можно указать одно значение больше “1” (n), чтобы автоматически разбить данные на (n) классов, либо вручную прописать диапазоны, указывая последнюю границу для класса через пробел (например, чтобы разбить данные на классы: 1. До 50, 2. До 140, 3. До 346 необходимо в поле “Диапазоны/число диапазонов” вписать: “50 140 346”). При этом для корректного срабатывания алгоритма классификации последнее значение должно превышать или быть равно максимальному значению в колонке.


Сегментация изображений

Колонка должна содержать относительные пути к изображениям масок сегментации, находящимся в одном архиве вместе с выбранной таблицей.

Пример таблицы.

Путь к маскам

segments/segm-001.jpg

segments/segm-002.jpg

segments/segm-003.jpg

segments/segm-004.jpg

Диапазон каналов

В поле Диапазон каналов следует ввести целочисленное значение диапазона для каждого из RGB каналов. Например, при цвете класса [201, 157, 21] и диапазоне 20 к данному классу будут отнесены все пиксели со значением в диапазонах [181-221, 137-177, 1-41].

Note

Значение диапазона индивидуально для каждой базы и зависит от степени потери качества изображений масок сегментации - чем больше потери в качестве, тем большее число рекомендуется к установке. Однако следует учесть, что при близком расположении цветов по RGB каналам, и значением Диапазон каналов бо́льшим этого расположения, классы могут пересечься. При отсутствии потери качества изображений масок сегментации, диапазон следует установить равным 0.

Ввод данных

Режим Ручной ввод предполагает ручное заполнение полей Название класса и Цвет. Количество блоков с полями к заполнению соответствует количеству классов, указанному в поле Количество классов.

Режим Автоматический поиск проводит поиск цветов классов в изображениях масок сегментации и выводит список найденных цветов пользователю для дальнейшего заполнения названий найденных классов. Для запуска поиска требуется заполнить поля Диапазон каналов и Количество классов.

Note

Поиск цветов классов осуществляется начиная с первой картинки в выбранной папке пока не будет найдено то количество цветов, которое было указано в поле Количество классов.

Режим Файл аннотации предполагает заполнение блоков с названиями и цветами классов из данных, полученных из файла аннотации. Для работы этого режима архив с датасетом должен содержать файл аннотации в корректном исполнении. Пример корректного файла аннотации можно найти здесь.


Классификация

В качестве данных для скейлера принимается колонка с любым типом данных.

Note

Обратите внимание, что поиск классов осуществляется через поиск уникальных значений. Таким образом, “Машина” и “машина” будут являться разными классами.

One-Hot encoding

Перевод числового значения в формат One-Hot encoding.

Перевод в OHE (4 класса).

Номер класса

Формат OHE

0

[1, 0, 0, 0]

1

[0, 1, 0, 0]

2

[0, 0, 1, 0]

3

[0, 0, 0, 1]

Тип предобработки

При выборе типа По категориям каждому значению в колонке будет присвоен номер класса в зависимости от общего количества уникальных значений в столбце.

При выборе типа По диапазонам появится поле ввода диапазонов, на которые необходимо разбить данные в колонке, которая должна содержать только числовые данные. Можно указать одно значение больше “1” (n), чтобы автоматически разбить данные на (n) классов, либо вручную прописать диапазоны, указывая последнюю границу для класса через пробел (например, чтобы разбить данные на классы: 1. До 50, 2. До 140, 3. До 346 необходимо в поле “Диапазоны/число диапазонов” вписать: “50 140 346”). При этом для корректного срабатывания алгоритма классификации последнее значение должно превышать или быть равно максимальному значению в колонке.


Регрессия

В качестве данных для регрессии необходимо выбрать одну колонку с числовыми данными.

Note

Колонка должна содержать только числовые данные с разделителем . и должна быть полность заполнена. Запись числа в формате 22,200.50 не допускается.

MinMaxScaler

В процессе обучения данный объект проводит поиск среди всех значений массивов с целью нахождения минимального и максимального значения. В дальнейшем, при использовании скейлера для трансформирования массива, все элементы интерполируются в диапазоне между минимальным и максимальным значением и значениями, указанными в полях Минимальный скейлер и Максимальный скейлер.

Пример трансформации вектора с использованием MinMaxScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

0.0

0.08

0.15

0.27

0.42

0.55

0.73

0.80

0.88

1.0

StandardScaler

При обучении скейлер проводит поиск среди всех значений массивов с целью находждения дисперсии, среднего значения. При использовании скейлера трансформация массивов происходит по формуле (x - среднее значение) / дисперсия.

Пример трансформации вектора с использованием StandardScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

-1.44

-1.20

-1.00

-0.65

-0.21

0.20

0.71

0.91

1.17

1.51

Не применять

При выборе данного режима никаких трансформаций массивов происходить не будет.


Временные ряды

Длина

В поле Длина следует ввести целочисленное значение количества значений временного ряда, на основе которых будет происходить предсказание.

Шаг

В поле Шаг следует ввести целочисленное значение сдвига окна временного ряда.

Глубина предсказания

В поле Глубина предсказания следует ввести целочисленное значение количества предсказаний временного ряда.

изображения_цветок_растянуть.png

Пример формирования массивов со следующими параметрами: Длина 300 (желтое), Шаг 50, Глубина предсказания 10 (зеленое).

Предсказывать тренд

При включенном режиме Предсказывать тренд все числовые значения на выходе будут разбиты на три класса: Не изменился, Вверх, Вниз.

Поле Отклонение нулевого тренда - это разница между начальным и конечным значением, в пределах которой отклонение тренда будет считаться нулевым (например, если Отклонение нулевого тренда равно 20, то при начальном значении 157 и конечном 169 (169-157=12) тренд будет считаться ни повышающимся, ни понижающимся).

Данное отклонение можно указывать как в абсолютных значениях, так и в “%” (например, 1.8%).

Скейлер

В процессе обучения данный объект проводит поиск среди всех значений массивов с целью нахождения минимального и максимального значения. В дальнейшем, при использовании скейлера для трансформирования массива, все элементы интерполируются в диапазоне между минимальным и максимальным значением и значениями, указанными в полях Минимальный скейлер и Максимальный скейлер.

Пример трансформации вектора с использованием MinMaxScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

0.0

0.08

0.15

0.27

0.42

0.55

0.73

0.80

0.88

1.0

StandardScaler

При обучении скейлер проводит поиск среди всех значений массивов с целью находждения дисперсии, среднего значения. При использовании скейлера трансформация массивов происходит по формуле (x - среднее значение) / дисперсия.

Пример трансформации вектора с использованием StandardScaler.

-3.96

-3.12

-2.44

-1.23

0.33

1.74

3.54

4.23

5.12

6.32

-1.44

-1.20

-1.00

-0.65

-0.21

0.20

0.71

0.91

1.17

1.51

Не применять

При выборе данного режима никаких трансформаций массивов происходить не будет.