J'enseigne la visualisation de données avec un sac de cailloux : voici pourquoi l'intégration spécifique au domaine est cruciale

I Teach Data Viz with a Bag of Rocks

J'enseigne la visualisation de données avec un sac de cailloux : voici pourquoi l'intégration spécifique au domaine est cruciale

Enseigner la visualisation de données avec des objets tangibles comme des roches peut sembler insolite, mais cela illustre parfaitement l'importance d'intégrer des connaissances spécifiques au domaine dans les workflows de science des données. Jeudi dernier, mon co-instructeur et moi avons apporté un sac de cailloux à notre cours de visualisation de données à l'Université de Washington. Cette activité inhabituelle a servi de base à une réflexion profonde sur les compétences nécessaires aux futurs scientifiques des données.

Notre sac contenait une collection diversifiée de roches, ramassées lors de randonnées dans différentes régions de Californie. Bien que nos étudiants soient habitués à nos activités pratiques, celle-ci a particulièrement suscité leur curiosité. L'exercice avait trois objectifs principaux : identifier les roches sans aide technologique, affiner cette identification avec des ressources en ligne, puis créer une visualisation comparative de leurs caractéristiques.

L'activité a débuté par la formation de groupes, chacun devant sélectionner deux roches. La première étape consistait à les identifier simplement par observation, ce qui a permis aux étudiants de distinguer les trois grands types de roches : ignées, sédimentaires et métamorphiques. Ensuite, avec l'aide d'internet, ils ont pu préciser leurs identifications, reconnaissant des spécimens comme la scorie, l'ardoise ou le jaspe rouge.

La partie la plus enrichissante fut la création de visualisations. Certains groupes ont opté pour des tableaux comparatifs, déclenchant une discussion sur l'utilité de ce format pour des données limitées ou nécessitant une précision absolue. D'autres ont exploré des représentations plus créatives, permettant d'aborder l'utilisation efficace des couleurs et des surfaces comme encodages visuels.

Le moment clé survint lorsque j'ai demandé pourquoi utiliser des roches plutôt que des jeux de données classiques. Après un silence perplexe, un étudiant a saisi l'essence : se familiariser avec des domaines inconnus. C'est exactement cela. En science des données, on est rarement expert du domaine étudié, mais on doit pourtant pouvoir travailler efficacement avec ses données spécifiques.

Cette réalité est fondamentale. Dans un article précédent, j'avais identifié trois piliers de la science des données : statistiques, informatique et domaine d'application. Sans ce dernier, les deux premiers n'ont pas de raison d'être. Nos étudiants, majoritairement orientés vers l'ingénierie des données ou la recherche UX/UI, ont ainsi expérimenté la nécessité de s'adapter rapidement à un nouveau domaine.

Pour tout aspirant scientifique des données, cette leçon est cruciale : il faut constamment se confronter à de nouvelles données provenant de domaines variés. Chaque discipline génère des données, et chaque ensemble de données représente une opportunité d'appliquer ses compétences analytiques. La prochaine fois qu'on vous fera appel pour extraire des insights, ce pourrait bien être dans un domaine que vous ne maîtrisez pas encore - et c'est là que réside tout l'intérêt du métier.

Dạy Trực Quan Hóa Dữ Liệu Bằng Một Túi Đá: Bài Học Về Tích Hợp Kiến Thức Chuyên Ngành Trong Khoa Học Dữ Liệu

Trong một buổi học môn Trực quan hóa dữ liệu tại Đại học Washington, giảng viên đã khiến sinh viên bất ngờ khi yêu cầu họ làm việc với một túi đá đa dạng. Hoạt động tưởng chừng kỳ quặc này thực chất ẩn chứa bài học sâu sắc về tầm quan trọng của việc tích hợp kiến thức chuyên ngành trong quy trình khoa học dữ liệu.

Buổi học diễn ra vào thứ Năm tuần trước với sự tham gia của hai giảng viên và các sinh viên khóa học. Mỗi nhóm được yêu cầu chọn hai viên đá, xác định loại đá ban đầu mà không dùng internet, sau đó tra cứu thông tin chi tiết và cuối cùng thiết kế biểu đồ so sánh hoặc trình bày thông tin về chúng.

Quá trình này giúp sinh viên thực hành các kỹ năng trực quan hóa dữ liệu cơ bản. Một nhóm đã sử dụng bảng dữ liệu để so sánh các loại đá, dẫn đến thảo luận về vai trò của bảng biểu trong trực quan hóa dữ liệu. Các nhóm khác thảo luận về cách mã hóa thông tin qua diện tích hay lựa chọn thang màu phù hợp.

Phần quan trọng nhất của buổi học là cuộc thảo luận về lý do sử dụng đá - một lĩnh vực xa lạ với hầu hết sinh viên. Một sinh viên đã nhận ra bài học then chốt: làm quen với các lĩnh vực chuyên môn không quen thuộc là kỹ năng thiết yếu trong khoa học dữ liệu.

Trong thực tế, các nhà khoa học dữ liệu hiếm khi đồng thời là chuyên gia về lĩnh vực mà họ đang làm việc. Họ phải nhanh chóng thích nghi và xử lý các loại dữ liệu từ nhiều ngành khác nhau. Việc tiếp xúc với những lĩnh vực mới trong quá trình đào tạo giúp họ phát triển khả năng thích ứng này.

Khóa học này được thiết kế đặc biệt cho sinh viên ngành thiết kế và kỹ thuật, những người sẽ làm việc trong các lĩnh vực như nghiên cứu UI/UX hay kỹ thuật dữ liệu. Lựa chọn chủ đề về đá nhằm đảm bảo sinh viên phải làm việc với dữ liệu hoàn toàn mới, từ đó rèn luyện khả năng phân tích độc lập.

Bài học từ buổi học này có giá trị với bất kỳ ai quan tâm đến khoa học dữ liệu. Dù bạn là sinh viên, người mới bắt đầu hay chuyên gia, việc không ngừng tiếp xúc với các loại dữ liệu mới từ nhiều lĩnh vực khác nhau sẽ mở rộng khả năng và cơ hội nghề nghiệp của bạn.

Mọi lĩnh vực đều sản sinh dữ liệu và cần người có khả năng phân tích chúng. Là nhà khoa học dữ liệu, bạn có thể trở thành cầu nối giữa dữ liệu và những hiểu biết giá trị - bất kể đó là dữ liệu về đá hay bất cứ lĩnh vực nào khác trong thế giới đa dạng này.