extraireCitation.php 3.06 KB
Newer Older
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
<html lang="fr">
    <head>
        <meta charset="utf-8"/>
        <title>Test</title>
    </head>
    <body>
 
    </body>
</html>

<?php

function suppr_accents($str, $encoding='utf-8')
{
    // transformer les caractères accentués en entités HTML
    $str = htmlentities($str, ENT_NOQUOTES, $encoding);
 
    // remplacer les entités HTML pour avoir juste le premier caractères non accentués
    // Exemple : "&ecute;" => "e", "&Ecute;" => "E", "à" => "a" ...
    $str = preg_replace('#&([A-za-z])(?:acute|grave|cedil|circ|orn|ring|slash|th|tilde|uml);#', '\1', $str);
 
    // Remplacer les ligatures 
    // Exemple "œ" => "oe"
    $str = preg_replace('#&([A-za-z]{2})(?:lig);#', '\1', $str);
    // Supprimer tout le reste
    $str = preg_replace('#&[^;]+;#', '', $str);
 
    return $str;
}



    $fichier="../../data/testCitations.txt";
    $handle=fopen($fichier,"r");
    $content=fread($handle,filesize($fichier));
    $split=explode("\n",$content); //on separe pour chaque saut de ligne
	$i=0;
	
	$citation=""; //string pour récupérer la citation

	$matrice = array(); //matrice qui pour chaque ligne va contenir le nom de l'auteur - la source - la date - la citation
	$colonneMatrice=0;
43
	$ligneMatrice=0; 
44
45
46

	
	
47
48

	foreach ($split as $motCourant){
49
50
51
52
53
54
55
56
57
									 

		
		if(stristr($split[$i],'—')){ //on sait que cest la ligne de l'auteur


			$colonneMatrice=0;
			$string1 = stristr($split[$i], '—'); //ne recupere que la ligne ou il y a —
			
58

59
60
61
62
63
64
65
66
			
			$split1= explode(",",$string1); //separe la ligne au niveau des virgules
			
			$j=0;
			
			foreach($split1 as $motCourant){ //affichage avec la séparation au niveau des virgules.
				
				if($j==0){ // si cest l'auteur alors on enleve les accents et on met en majuscules
67
68
					$split1[$j] = strtoupper(suppr_accents($split1[$j])); //enleve accents et met en MAJ
					$matrice[$ligneMatrice][$colonneMatrice] = $split1[$j]; 
69
70
71
72
					//echo $matrice[$ligneMatrice][$colonneMatrice];
					$colonneMatrice++;
				}
				else{ // sinon affichage normal
73
					if($j==1){
Clement GAUDUCHEAU's avatar
Clement GAUDUCHEAU committed
74
75
						if((preg_match("#^[\" \"][^p]#",$split1[$j])))
							$matrice[$ligneMatrice][$colonneMatrice] = $split1[$j];
76
77
78
79
80
					}
					else{
						$split1[$j] = suppr_accents($split1[$j]);
						//echo $split1[$j];
						//"#^[^p][(]?[\" \"]?[1|2|3]?[1-9]?[\" \"]?[JAN|FEV|MAR|AVR|MAI|JUI|AOU|SEP|OCT|NOV|DEC]{0,1}[a-zA-Z]*[^p]?[\" \"]?[1|2]?[0-9]{3}[)]?#i"
Clement GAUDUCHEAU's avatar
Clement GAUDUCHEAU committed
81
						if(preg_match("#^[\" \"|\"\"][^p][(]?[\" \"]?[1|2|3]?[1-9]?[\" \"]?[JAN|FEV|MAR|AVR|MAI|JUI|AOU|SEP|OCT|NOV|DEC]{0,1}[a-zA-Z]*[^p]?[\" \"]?[1|2]?[0-9]{3}[)]?#i", $split1[$j])){
82
83
84
85
86
87
88
89
						
						$matrice[$ligneMatrice][$colonneMatrice] = $split1[$j];
					 	} //fin regex	
						else{
							$matrice[$ligneMatrice][$colonneMatrice] = null;
						}
					}
					
90
91
92
93
					//echo $matrice[$ligneMatrice][$colonneMatrice];
					$colonneMatrice++;
				}				
				$j++;
94
			}//fin foreach
95
			
96
			$ligneMatrice++;
97
98
		}

99
/*		?>
100
101
		</br>
		<?php
102
*/
103
		$i++;
104
		
105
106
107
108
	}
	
	
	
109
110
111
112
113
	for($k=0; $k<$ligneMatrice;$k++){
		for($j=0; $j<10; $j++){
			if(isset($matrice[$k][$j]) && ($matrice[$k][$j]!=null)){
				echo $matrice[$k][$j];
			}
114
		}
115
116
117
		?>
		</br>
		<?php
118
	}
119

120
?>