2021-STID2-MoviesAndTVshowsOnNetflix

Netflix est un service de streaming sur abonnement qui permet aux utilisateurs de regarder des séries et des films sans publicité sur n’importe quel appareil connecté à Internet.
Avec plus de 180 millions d'abonnés dans plus de 190 pays et plus de 125 millions d'heures de programmes visionnées par jour, Netflix est le leader mondial de la TV en streaming. En France, il y a 6,7 millions d’abonnés à Netflix, soit 1 français sur 10.
En 1997 Reed Hastings et Marc Randolph, les cofondateurs de Netflix décident de mélanger deux concepts : la location de films et la vente par correspondance. Ces deux concepts prennent forme grâce à un nouvel objet tout récent : le DVD.
La plate-forme de location met rapidement en place un système d’abonnement et des algorithmes qui lui permettent de proposer une offre personnalisée à ses clients. Et, c’est en 2007 que Netflix passe du DVD au streaming. Depuis, son succès est peu contesté.
Malgré ses réussites, la firme est accusée, par le milieu cinématographique, d’une concurrence déloyale.

Slides & Videos

Members

NameContribution
Natacha Batmini BATMANABANE-Choix des données
-Rédaction de l'état de l'art
-Diaporama avec Prezi
Ashwini SAMUEL-Choix des données
-Rédaction de l'état de l'art
Ornella ANY-Choix des données
-Rédaction de l'état de l'art
Natacha BATMANABANE Ashwini SAMUEL Ornella ANYLe premier jeu de données est basé sur les films sur les différents platforms de streaming par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/movies-on-netflix-prime-video-hulu-and-disney
Nous avons choisi ces variables pour notre analyse:
Nom du film va nous permettre de faire des analyses sur les films en trilogies par exemple
Année de création du film va nous permettre de voir le succès des films par période
Imdb sont des notes données au film sur le site IMDb
Rotten Tomatoes est une note moyenne en pourcentage donné par l'utilisateur Netfilx
(Analyse entre les 2 notes)
Utiliser les films qui existent sur Netflix c'est-à dire où la colonne Netflix donne 1
Le second jeu de données est basé sur les émissions sur les différents platforms de streaming par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/tv-shows-on-netflix-prime-video-hulu-and-disney
Nous avons choisi ces variables pour notre analyse:
Nom des émissions va nous permettre de différencier
Année de production du film va nous permettre de voir le succès des films par période
Imdb sont des notes données aux émissions sur le site IMDb
Rotten Tomatoes est une note moyenne en pourcentage donné par l'utilisateur Netfilx
(Analyse entre les 2 notes)
Utiliser les émissions qui existent sur Netflix c'est-à dire où la colonne Netflix donne 1
Le troisième jeu de données est sur Movies and TV Shows de Netflix de Shivam Bansal qui a été ajouté en février 2021, https://www.kaggle.com/shivamb/netflix-shows
Nous avons choisi ces variables pour notre analyse:
type pour distinguer les émissions et les films
réalisateur va nous permettre l’influence des réalisateurs sur l’audience
pays va nous permettre de faire des analyses sur la diversité que propose netflix
Date à laquelle le film ou l’émission a été ajouté sur Netflix
Année de réalisation va nous permettre de faire la différence avec la date à laquelle le film ou l’émission a été ajouté sur Netflix
durée du film ou le nombre de saisons de l’émission va nous permettre de connaître l’implication de la durée
Le quatrième jeu de données est Trending TV shows on Netflix de Rithesh Yadav en juillet 2020.
Nous avons choisi ces variables pour notre analyse:
https://www.kaggle.com/ritesh2000/trending-tv-shows-on-netflix
Titre de la série pour distinguer
Année de réalisation va nous permettre de voir l’audience
imdb sont des notes qui va nous permettre de classer les émissions
Netflix qui nous permettra de savoir si elle existe sur Netflix

State of the Art

Business Aspect

Business Aspect

Notre analyse sur les films et les émissions de Netflix intéressera les abonnés ou futurs abonnés de la plateforme. Cela permettra au public d’avoir plus de connaissances et un avis critique sur l’ensemble de Netflix.

Nous avons trouvé peu d’ études sur Netflix. Ainsi, nos analyses auront un impact global sur le marché du streaming. En effet, en ajoutant nos analyses les abonnés seront plus actifs sur Netflix.

 

L’article écrit par Nicolas en 2018

L’article écrit par Nicolas en 2018 cite que : “Pour faire simple, plus on utilise la plateforme, plus elle collecte des données sur nous, plus ses propositions seront qualitatives.”

« House of Cards » est la première série conçue  à partir du BigData. Les algorithmes ont simplement indiqué qu’une série sur le monde politique avec l’acteur Kevin Spacey et réalisée par David Fincher serait un blockbuster. Comme prévu, la série a du succès.Désormais, les préférences des abonnés influencent toutes les décisions du streaming. Mais Netflix n’est pas un cas à part et l’ensemble des acteurs mondiaux du digital se servent plus que jamais du Big Data pour leurs activités.

 

IAS Insider a fait une étude le 12 mai 2020 sur la  TV Connectée et Streaming Vidéo

Netflix domine le secteur des plateformes de SVOD, avec deux tiers des internautes abonnés soit 67%.  Amazon Prime qui est 2ème avec 28%. À noter que l’étude a été réalisée en mars 2020, soit avant le lancement de Disney+.

 

 

Des étudiants de Nyc Data Science ont développé une application en ligne qui présente les données de Netflix.

Ils ont fait une analyse sur les abonnées,  l’année d’ajout sur Netflix et les acteurs.

Leur but était de savoir ce qu’il y a sur Netflix et son impact dans le monde à travers ces abonnés. C’est une étude importante pour Netflix car elle met en avant les avantages et succès de la plateforme.

l’ensemble des données sont obtenues à partir de kaggle.com, qui sont à leur tour  recueillies sur flixable.com qui permet aux utilisateurs de parcourir le contenu actuellement disponible sur Netflix États-Unis.

Technical Aspect

Les films sur les différentes plateformes de streaming  par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. 

Elle a voulu mettre en avant le classement des notes IMDb (site de données sur les films et séries),moyennes des films produits dans un pays, la popularité d’un film par rapport aux réalisateurs et avertir sur les limites d’âges des films et séries de la plateforme.

Au niveau de la base de données, on note 69% de données manquantes pour la variable Rotten Tomatoes et 56% pour la variable limites d’âge. Ce qui biaise les résultats de son analyse.

Etude:https://public.tableau.com/profile/ruchi.bhatia#!/vizhome/Moviesavailableonstreamingplatforms/Moviesavailableonstreamingapplications

liste complète des émissions de télévision disponibles sur les plateformes de streaming

Ce second jeu de données comprennent une liste complète des émissions de télévision disponibles sur : Netflix, Hulu, Prime Vidéo et Disney+.  Il propose des comparaisons entre les différentes émissions et le classement des notes IMDb des émissions de télé que l’on trouve sur ces plateformes. Elle permet d’avertir sur les limites d’âges des films et séries et de connaître l’efficacité des différentes plateformes, c’est-à-dire, si l’année de production d’une émission de télévision est proche ou non de l’année de diffusion sur ces plateformes de streaming. L’échantillon de ce jeu de données n’est pas représentatif car, par exemple, dans la variable rotten tomatoes, la majorité des données sont des valeurs manquantes (82%). De plus,la majorité des émissions sélectionnées dans cet échantillon ne sont pas des émissions présentes sur ces plateformes de streaming.    

 

TV Shows de Netflix de Shivam Bansal qui a été ajouté en janvier 2021. 

Son but était de comprendre quel contenu est disponible dans différents pays,identifier le contenu similaire en faisant correspondre les fonctionnalités textuelles,trouver des liens entre les réseaux acteurs-réalisateurs et enfin savoir si Netflix se concentre plus sur les films ou les séries ces dernières années. 

Cet échantillon de 50 Tv Shows ne contiennent que 19 de Netflix ce qui est précaire pour une étude sur Netflix.

top 50 des émissions de télévision tendance actuellement disponibles sur Netflix

Les données de ce 4ème jeu sont une collection de top 50 des émissions de télévision tendance actuellement disponibles sur Netflix. Il lui a permis de faire des études sur l’année de sortie et les notes IMDb de ces émissions.                                          

L’échantillon de ce jeu de données n’est pas significatif car il s’agit d’une étude sur les émissions de télévision tendance sur Netflix or, on peut compter plus d’émissions non présentes sur Netflix que présentes.   

   

Project Description

Problem Definition
En quoi Netflix est mieux que les autres plateformes de streaming?
Comment les films et les séries proposés par Netflix font le succès de la plateforme?
Quels sont les critères que les utilisateurs prennent en compte avant de regarder un film ou une série sur Netflix ?


Challenges & Motivation
Nos principaux challenges sont la diversité des études déjà disponibles sur le sujet mais aussi la similitude des données disponibles malgré qu’elles sont issues de sources différentes.
Real and Complete Usecases

Notre proposition

 

Nous proposons une analyse sur les classements, l’audience et les caractéristiques des films et séries de Netflix.

 

Notre analyse sur les films et les émissions de Netflix intéressera les abonnés ou futurs abonnés de la plateforme. Cela permettra au public d’avoir plus de connaissances et un avis critique sur l’ensemble de Netflix.

Nous avons trouvé peu d’ études sur Netflix. Ainsi, nos analyses auront un impact global sur le marché du streaming. En effet, en ajoutant nos analyses les abonnés seront plus actifs sur Netflix.

Technical Description

CHOIX DES DONNEES

Le premier jeu de données est basé sur les films sur les différentes plateformes de streaming  par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/movies-on-netflix-prime-video-hulu-and-disney 

Nous avons choisi ces variables pour notre analyse: 

  • Nom du film va nous permettre de faire des analyses sur les films en trilogies par exemple 
  • Année de création du film va nous permettre de voir le succès des films par période 
  • Imdb sont des notes données au film sur le site IMDb 
  • Rotten Tomatoes est une note moyenne en pourcentage donné par l’utilisateur Netfilx 

(Analyse entre les 2 notes)

  • Utiliser les films qui existent sur Netflix c’est-à dire où la colonne Netflix donne 1 

Le second jeu de données est basé sur les émissions sur les différents platforms de streaming  par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/tv-shows-on-netflix-prime-video-hulu-and-disney  

Nous avons choisi ces variables pour notre analyse: 

  • Nom des émissions  va nous permettre de différencier
  • Année de production du film va nous permettre de voir le succès des films par période 
  • Imdb sont des notes données aux émissions sur le site IMDb 
  • Rotten Tomatoes est une note moyenne en pourcentage donné par l’utilisateur Netfilx 

(Analyse entre les 2 notes)

  • Utiliser les émissions  qui existent sur Netflix c’est-à dire où la colonne Netflix donne 1 

Le troisième jeu de données est sur  Movies and TV Shows de Netflix de Shivam Bansal qui a été ajouté en février 2021, https://www.kaggle.com/shivamb/netflix-shows 

Nous avons choisi ces variables pour notre analyse: 

  • type pour distinguer les émissions et les films 
  • réalisateur va nous permettre l’influence des réalisateurs sur l’audience 
  • pays va nous permettre de faire des analyses sur  la diversité que propose netflix 
  • Date à laquelle le film ou l’émission a été ajouté sur Netflix
  • Année de réalisation va nous permettre de faire la différence avec la date à laquelle le film ou l’émission a été ajouté sur Netflix
  • durée du  film ou le nombre de saisons de l’émission va nous permettre de connaître l’implication de la durée 

Le quatrième jeu de données est Trending TV shows on Netflix  de Rithesh Yadav en juillet 2020.

Nous avons choisi ces variables pour notre analyse: 

https://www.kaggle.com/ritesh2000/trending-tv-shows-on-netflix 

  • Titre de la série pour distinguer 
  • Année de réalisation va nous permettre de voir l’audience
  • imdb sont des notes qui va nous permettre de classer les émissions
  • Netflix qui nous permettra de savoir si elle existe sur Netflix

Hardware

Materials
ImageNamePart NumberPriceCountLink
Power BI et RGratuit🛒
Schematic

Software

External Services

COLAB RESEARCH MOVIE NETFLIX

Pour visualiser sur Power BI, il faut se connecter: 
numeroetudiant@edu.sorbonne-paris-nord.fr
m2p : votre mp ent