Scraper for ICASSP from IEEE

from bs4 import BeautifulSoup

The temporary file below is extracted from IEEE

with open("/tmp/icassp") as inf:
    html = inf.read()

soup = BeautifulSoup(html, 'html.parser')

top = soup.find("div", {"class": "issue-list-container"})

import re

data = []
for li in top.find_all("li", {"_ngcontent-ftl-c305": ""}):
    raw = li.text.strip()
    a_tag = li.find("a")
    href = a_tag.attrs["href"]
    title = a_tag.text.strip()
    m1 = re.search("^ICASSP (20\d\d).*", raw)
    m2 = re.search(".*((?:20|19)\d\d) (?:IEEE )?International.*", raw)
    m3 = re.search(".*ICASSP '(\d\d).*", raw)
    if m1:
        year = m1.group(1)
    elif m2:
        year = m2.group(1)
    elif m3:
        year = m3.group(1)
        # Why yes, in this, the Year of Our Lord, 2022,
        # writing this scraper has meant having to do
        # Y2K compensation
        if year.startswith("0"):
            year = "20" + year
        else:
            year = "19" + year
    elif raw == "International Conference on Acoustics, Speech, and Signal Processing":
        year = "1990"
    elif raw == "International Conference on Acoustics, Speech, and Signal Processing,":
        year == "1989"
    elif raw.startswith("ICASSP-88.,"):
        year = "1988"
    loc_tag = li.find("span", {"_ngcontent-ftl-c305": ""})
    if loc_tag:
        loc = loc_tag.text.strip().replace("Location: ", "")
    data.append([href, title, year, loc])

count = 1
data.reverse()
for item in data:
    item.append(str(count))
    count += 1
data.reverse()

template = "https://ieeexplore.ieee.org/rest/publication/home/metadata?pubid="

import requests

raw_json = requests.get(template + "9413349")

raw_json.text

'<HTML><HEAD><TITLE>Error</TITLE></HEAD><BODY>\nAn error occurred while processing your request.<p>\nReference&#32;&#35;30&#46;64aa2617&#46;1670514466&#46;8894ff4\n</BODY></HTML>\n'

Bah. Ok, API is a waste of time: limit is too low, registering for a key is a bit annoying for a one-time operation.

DOIs = """
10.1109/ICASSP43922.2022
10.1109/ICASSP39728.2021
DOI: 10.1109/ICASSP40776.2020
DOI: 10.1109/ICASSP35589.2019
DOI: 10.1109/ICASSP34228.2018
DOI: 10.1109/ICASSP31846.2017

DOI: 10.1109/ICASSP17257.2015
DOI: 10.1109/ICASSP18874.2014
DOI: 10.1109/ICASSP16080.2013
DOI: 10.1109/ICASSP15465.2012
DOI: 10.1109/ICASSP15948.2011
DOI: 10.1109/ICASSP15600.2010
DOI: 10.1109/ICASSP13629.2009
DOI: 10.1109/ICASSP12235.2008
DOI: 10.1109/ICASSP10710.2007
DOI: 10.1109/ICASSP10488.2006
DOI: 10.1109/ICASSP8829.2005
DOI: 10.1109/ICASSP.2004
DOI: 10.1109/ICASSP.2003
DOI: 10.1109/ICASSP.2002
DOI: 10.1109/ICASSP.2001
DOI: 10.1109/ICASSP.2000
DOI: 10.1109/ICASSP.1999
DOI: 10.1109/ICASSP.1998
DOI: 10.1109/ICASSP.1997
DOI: 10.1109/ICASSP.1996
DOI: 10.1109/ICASSP.1995
DOI: 10.1109/ICASSP.1994
DOI: 10.1109/ICASSP.1993
DOI: 10.1109/ICASSP.1992
DOI: 10.1109/ICASSP.1991
DOI: 10.1109/ICASSP.1990
DOI: 10.1109/ICASSP.1989
DOI: 10.1109/ICASSP.1988
DOI: 10.1109/ICASSP.1987
DOI: 10.1109/ICASSP.1986
DOI: 10.1109/ICASSP.1985
DOI: 10.1109/ICASSP.1984
DOI: 10.1109/ICASSP.1983
DOI: 10.1109/ICASSP.1982
DOI: 10.1109/ICASSP.1981
DOI: 10.1109/ICASSP.1980
DOI: 10.1109/ICASSP.1979
DOI: 10.1109/ICASSP.1978
DOI: 10.1109/ICASSP.1977
DOI: 10.1109/ICASSP.1976
"""

doi_dict = {}
for line in DOIs.replace("DOI: ", "").split("\n"):
    if line == "":
        continue
    parts = line.split(".")
    doi_dict[parts[-1]] = line

output = []
output.append("| Year | Ordinal | DOI | Issue | Location |")
output.append("|------|---------|-----|-------|----------|")
for item in data:
    #[href, title, year, loc, ord]
    if item[2] == "2016":
        doi = ""
    else:
        doi = doi_dict[item[2]]
    output.append(f"| {item[2]} | {item[4]} | {doi} | [{item[1]}](https://ieeexplore.ieee.org/{item[0]}) | {item[3]} |")

from IPython.display import display, Markdown

display(Markdown("\n".join(output)))

Year	Ordinal	DOI	Issue	Location
2022	47	10.1109/ICASSP43922.2022	ICASSP 2022 - 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Singapore, Singapore
2021	46	10.1109/ICASSP39728.2021	ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Toronto, ON, Canada
2020	45	10.1109/ICASSP40776.2020	ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Barcelona, Spain
2019	44	10.1109/ICASSP35589.2019	ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Brighton, UK
2018	43	10.1109/ICASSP34228.2018	2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Calgary, AB, Canada
2017	42	10.1109/ICASSP31846.2017	2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	New Orleans, LA, USA
2016	41		2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Shanghai, China
2015	40	10.1109/ICASSP17257.2015	2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	South Brisbane, QLD, Australia
2014	39	10.1109/ICASSP18874.2014	2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Florence, Italy
2013	38	10.1109/ICASSP16080.2013	2013 IEEE International Conference on Acoustics, Speech and Signal Processing	Vancouver, BC, Canada
2012	37	10.1109/ICASSP15465.2012	2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Kyoto, Japan
2011	36	10.1109/ICASSP15948.2011	2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)	Prague, Czech Republic
2010	35	10.1109/ICASSP15600.2010	2010 IEEE International Conference on Acoustics, Speech and Signal Processing	Dallas, TX, USA
2009	34	10.1109/ICASSP13629.2009	2009 IEEE International Conference on Acoustics, Speech and Signal Processing	Taipei, Taiwan
2008	33	10.1109/ICASSP12235.2008	2008 IEEE International Conference on Acoustics, Speech and Signal Processing	Las Vegas, NV, USA
2007	32	10.1109/ICASSP10710.2007	2007 IEEE International Conference on Acoustics, Speech and Signal Processing - ICASSP '07	Honolulu, HI, USA
2006	31	10.1109/ICASSP10488.2006	2006 IEEE International Conference on Acoustics Speech and Signal Processing Proceedings	Toulouse, France
2005	30	10.1109/ICASSP8829.2005	Proceedings. (ICASSP '05). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005.	Philadelphia, PA, USA
2004	29	10.1109/ICASSP.2004	2004 IEEE International Conference on Acoustics, Speech, and Signal Processing	Montreal, QC, Canada
2003	28	10.1109/ICASSP.2003	2003 IEEE International Conference on Acoustics, Speech, and Signal Processing, 2003. Proceedings. (ICASSP '03).	Hong Kong, China
2002	27	10.1109/ICASSP.2002	2002 IEEE International Conference on Acoustics, Speech, and Signal Processing	Orlando, FL, USA
2001	26	10.1109/ICASSP.2001	2001 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No.01CH37221)	Salt Lake City, UT, USA
2000	25	10.1109/ICASSP.2000	2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No.00CH37100)	Istanbul, Turkey
1999	24	10.1109/ICASSP.1999	1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings. ICASSP99 (Cat. No.99CH36258)	Phoenix, AZ, USA
1998	23	10.1109/ICASSP.1998	Proceedings of the 1998 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP '98 (Cat. No.98CH36181)	Seattle, WA, USA
1997	22	10.1109/ICASSP.1997	1997 IEEE International Conference on Acoustics, Speech, and Signal Processing	Munich, Germany
1996	21	10.1109/ICASSP.1996	1996 IEEE International Conference on Acoustics, Speech, and Signal Processing Conference Proceedings	Atlanta, GA, USA
1995	20	10.1109/ICASSP.1995	1995 International Conference on Acoustics, Speech, and Signal Processing	Detroit, MI, USA
1994	19	10.1109/ICASSP.1994	Proceedings of ICASSP '94. IEEE International Conference on Acoustics, Speech and Signal Processing	Adelaide, SA, Australia
1993	18	10.1109/ICASSP.1993	1993 IEEE International Conference on Acoustics, Speech, and Signal Processing	Minneapolis, MN, USA
1992	17	10.1109/ICASSP.1992	[Proceedings] ICASSP-92: 1992 IEEE International Conference on Acoustics, Speech, and Signal Processing	San Francisco, CA, USA
1991	16	10.1109/ICASSP.1991	[Proceedings] ICASSP 91: 1991 International Conference on Acoustics, Speech, and Signal Processing	Toronto, ON, Canada
1991	15	10.1109/ICASSP.1991	International Conference on Acoustics, Speech, and Signal Processing	Albuquerque, NM, USA
1991	14	10.1109/ICASSP.1991	International Conference on Acoustics, Speech, and Signal Processing,	Glasgow, UK
1988	13	10.1109/ICASSP.1988	ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing	New York, NY, USA
1987	12	10.1109/ICASSP.1987	ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing	Dallas, TX, USA
1986	11	10.1109/ICASSP.1986	ICASSP '86. IEEE International Conference on Acoustics, Speech, and Signal Processing	Tokyo, Japan
1985	10	10.1109/ICASSP.1985	ICASSP '85. IEEE International Conference on Acoustics, Speech, and Signal Processing	Tampa, FL, USA
1984	9	10.1109/ICASSP.1984	ICASSP '84. IEEE International Conference on Acoustics, Speech, and Signal Processing	San Diego, CA, USA
1983	8	10.1109/ICASSP.1983	ICASSP '83. IEEE International Conference on Acoustics, Speech, and Signal Processing	Boston, MA, USA
1982	7	10.1109/ICASSP.1982	ICASSP '82. IEEE International Conference on Acoustics, Speech, and Signal Processing	Paris, France
1981	6	10.1109/ICASSP.1981	ICASSP '81. IEEE International Conference on Acoustics, Speech, and Signal Processing	Atlanta, GA,USA
1980	5	10.1109/ICASSP.1980	ICASSP '80. IEEE International Conference on Acoustics, Speech, and Signal Processing	Denver, CO, USA
1979	4	10.1109/ICASSP.1979	ICASSP '79. IEEE International Conference on Acoustics, Speech, and Signal Processing	Washington, DC, USA
1978	3	10.1109/ICASSP.1978	ICASSP '78. IEEE International Conference on Acoustics, Speech, and Signal Processing	Tulsa, OK, USA
1977	2	10.1109/ICASSP.1977	ICASSP '77. IEEE International Conference on Acoustics, Speech, and Signal Processing	Hartford, CT, USA
1976	1	10.1109/ICASSP.1976	ICASSP '76. IEEE International Conference on Acoustics, Speech, and Signal Processing	Philadelphia, PA, USA