Бизнес-аналитика. Извлечение, преобразование и загрузка данных | страница 8



— удалить пробелы, которые мешают преобразованию в число;

— возможно, удалить запятую и два нуля в конце строк;

— преобразовать тип данных в числовой и настроить формат вывода на экран.

Мало того, в данных за 2015 год отсутствует один пробел.

Выделяем третий столбец и начинаем проводить перечисленные преобразования.

Замена пробела на «ничто» не удалась.

Попробуем выяснить причину.

Возвращаемся в браузер и вызываем просмотр исходного текста страницы сайта (рис. 3.18). Нажимаем правую кнопку мыши и в контекстном меню выбираем

View Page Source.

Мы работаем в браузере Firefox. В других браузерах функция просмотра исходного текста может скрываться в другом месте.


Рис. 3.18. Переход к исходному тексту страницы


Задание. Откройте исходный текст страницы.


Рассматриваем полученный текст (рис. 3.19).

Между тройками цифр стоит загадочная комбинацию букв.

А в неудачной строке за 2015 год есть и пробел, и эти загадочные буквы. В конце числа пробел действительно отсутствует.


Рис. 3.19. Фрагмент исходного текста


Задание. Ознакомьтесь с представлением данных за 2015 и 2016 годы в исходном тексте.


Поищем в интернете ответ на вопрос:

что такое  

Выясняется, что это так называемый НЕРАЗРЫВНЫЙ ПРОБЕЛ (рис. 3.20).

Английское название: non-breaking space.

Сокращённое обозначение: NBSP — Non-Breaking Space.


Рис. 3.20. Описание неразрывного пробела


Задание. Прочитайте в Википедии статью «Неразрывный пробел» и выясните, в каких случаях его рекомендуют применять, а также как его вставлять в редакторе Microsoft Word.


Мы разобрались, что это было. Оно только выглядит как пробел. На самом деле, это другой символ. Поэтому поиск обычного пробела ничего не дал.

Снова вызываем функцию поиска и замены:

Replace Values.

На этот раз сделаем всё правильно (рис. 3.30).

Раскрываем дополнительные возможности

Advanced Options.

Ставим отметку для выбора специальных символов:

Replace using special characters.

Неразрывный пробел относится как раз к специальным символам.

Щёлкаем по строке поиска:

Value To Find.

Раскрываем выпадающий список:

Insert special character.

Выбираем в этом списке тот самый неразрывный пробел:

Non-breaking Space.

А вот в строке замены не пишем ничего.

Значит пробел заменят на ничто. То есть мы все эти символы удаляем.

Нажимаем ОК.


Рис. 3.30. Удаление неразрывного пробела


Задание. Удалите неразрывные пробелы в третьем столбце.


Рассмотрим полученные результаты (рис. 3.31).

Числа стали похожи на числа.

Но в данных за 2015 год остался один пробел.