Бизнес-аналитика. Извлечение, преобразование и загрузка данных | страница 8
— удалить пробелы, которые мешают преобразованию в число;
— возможно, удалить запятую и два нуля в конце строк;
— преобразовать тип данных в числовой и настроить формат вывода на экран.
Мало того, в данных за 2015 год отсутствует один пробел.
Выделяем третий столбец и начинаем проводить перечисленные преобразования.
Замена пробела на «ничто» не удалась.
Попробуем выяснить причину.
Возвращаемся в браузер и вызываем просмотр исходного текста страницы сайта (рис. 3.18). Нажимаем правую кнопку мыши и в контекстном меню выбираем
View Page Source.
Мы работаем в браузере Firefox. В других браузерах функция просмотра исходного текста может скрываться в другом месте.
Рис. 3.18. Переход к исходному тексту страницы
Задание. Откройте исходный текст страницы.
Рассматриваем полученный текст (рис. 3.19).
Между тройками цифр стоит загадочная комбинацию букв.
А в неудачной строке за 2015 год есть и пробел, и эти загадочные буквы. В конце числа пробел действительно отсутствует.
Рис. 3.19. Фрагмент исходного текста
Задание. Ознакомьтесь с представлением данных за 2015 и 2016 годы в исходном тексте.
Поищем в интернете ответ на вопрос:
что такое
Выясняется, что это так называемый НЕРАЗРЫВНЫЙ ПРОБЕЛ (рис. 3.20).
Английское название: non-breaking space.
Сокращённое обозначение: NBSP — Non-Breaking Space.
Рис. 3.20. Описание неразрывного пробела
Задание. Прочитайте в Википедии статью «Неразрывный пробел» и выясните, в каких случаях его рекомендуют применять, а также как его вставлять в редакторе Microsoft Word.
Мы разобрались, что это было. Оно только выглядит как пробел. На самом деле, это другой символ. Поэтому поиск обычного пробела ничего не дал.
Снова вызываем функцию поиска и замены:
Replace Values.
На этот раз сделаем всё правильно (рис. 3.30).
Раскрываем дополнительные возможности
Advanced Options.
Ставим отметку для выбора специальных символов:
Replace using special characters.
Неразрывный пробел относится как раз к специальным символам.
Щёлкаем по строке поиска:
Value To Find.
Раскрываем выпадающий список:
Insert special character.
Выбираем в этом списке тот самый неразрывный пробел:
Non-breaking Space.
А вот в строке замены не пишем ничего.
Значит пробел заменят на ничто. То есть мы все эти символы удаляем.
Нажимаем ОК.
Рис. 3.30. Удаление неразрывного пробела
Задание. Удалите неразрывные пробелы в третьем столбце.
Рассмотрим полученные результаты (рис. 3.31).
Числа стали похожи на числа.
Но в данных за 2015 год остался один пробел.